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内 容 简 介 


本 书 主要 介绍 操作 系统 的 核心 功能 一 一 用 户 接口 .进程 管理 ,处理 机 调度 与 死 锁 、 存 储 管理 ,设备 管 
理 , 文 件 管理 及 其 主要 思想 与 设计 原理 ,多 处 理 机 系统 及 肉 入 式 操作 系统 基本 原理 与 应 用 环境 ,操作 系统 
安全 技术 ; 以 Linux 为 例 , 分 析 了 操作 系统 的 核心 代码 的 实现 方法 ,技术 以 及 操作 系统 各 个 功能 部 分 的 关 
联 实现 技巧 ; 在 此 基础 上 ,从 操作 系统 的 发 展 需求 及 计算 机 体系 结构 的 发 展 角度 介绍 当前 操作 系统 发 展 的 
新 趋势 。 

本 书 内 容 基 本 覆盖 了 全 国 研 究 生 招生 考试 操作 系统 考试 大 纲 主 要 内 容 , 书 中 列举 了 大 量 实例 ,力求 将 
抽象 的 概念 具体 化 ,将 复杂 的 理论 与 实际 联系 起 来 ; 书 中 还 提供 了 大 量 习题 ,其 中 既 有 一 般 概 念 和 基本 原 
理 测试 题 ,还 包括 近年 来 全 国 计 算 机 等 级 考试 与 研究 生 招生 考试 试题 。 本 书 既 可 作为 计算 机 及 相关 专业 
的 教材 和 等 级 考试 .考研 辅导 书 , 也 可 供 从 事 计算 机 工作 的 科技 人 员 参 考 。 
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随 着 我 国 改革 开放 的 进一步 深化 ,高 等 教育 也 得 到 了 快速 发 展 ,各 地 高 校 紧 密 结合 地 方 
经 济 建设 发 展 需要 ,科学 运用 市 场 调节 机 制 , 加 大 了 使 用 信息 科学 等 现代 科学 技术 提升 、 改 
造 传统 学 科 专 业 的 投入 力度 ,通过 教育 改革 合理 调整 和 配置 了 教育 资源 ,优化 了 传统 学 科 专 
业 ,积极 为 地 方 经 济 建设 输送 人 才 , 为 我 国 经 济 社会 的 快速 、 健 康 和 可 持续 发 展 以 及 高 等 教 
育 自身 的 改革 发 展 做 出 了 巨大 贡献 。 但 是 ,高 等 教育 质量 还 需要 进一步 提高 以 适应 经 济 社 
会 发 展 的 需要 ,不 少 高 校 的 专业 设置 和 结构 不 尽 合理 ,教师 队伍 整体 素质 最 待 提 高 ,人 才 培 
养 模式 .教学 内 容 和 方法 需要 进一步 转变 ,学 生 的 实践 能 力 和 创新 精神 牙 待 加 强 。 

教育 部 一 直 十 分 重视 高 等 教育 质量 工作 。2007 年 1 月 ,教育 部 下 发 了 《关于 实施 高 等 
学 校本 科教 学 质量 与 教学 改革 工程 的 意见 》, 计 划 实 施 “ 高 等 学 校本 科教 学 质量 与 教学 改革 
工程 "(简称 “质量 工程 ”) ,通过 专业 结构 调整 .课程 教材 建设 .实践 教学 改革 教学 团队 建设 
等 多 项 内 容 , 进 一 步 深化 高 等 学 校 教 学 改革 ,提高 人 才 培 养 的 能 力 和 水 平 ,更 好 地 满足 经 济 
社会 发 展 对 高 素质 人 才 的 需要 。 在 贯彻 和 落实 教育 部 “质量 工程 ”的 过 程 中 ,各 地 高 校 发 挥 
师资 力量 强 、 办 学 经 验 丰 富 、 教 学 资源 充裕 等 优势 ,对 其 特色 专业 及 特色 课程 ( 群 ) 加 以 规划 、 
整理 和 总 结 ,更 新 教学 内 容 、 改 革 课 程 体系 ,建设 了 一 大 批 内 容 新 、 体 系 新 、 方 法 新 、 手 段 新 的 
特色 课程 。 在 此 基础 上 ,经 教育 部 相关 教学 指导 委员 会 专家 的 指导 和 建议 ,清华 大 学 出 版 社 
在 多 个 领域 精 选 各 高 校 的 特色 课程 .分别 规划 出 版 系列 教材 ,以 配合 “质量 工程 ”的 实施 , 满 
足 各 高 校 教学 质量 和 教学 改革 的 需要 。 

为 了 深入 贯彻 落实 教育 部 (关于 加 强 高 等 学 校本 科教 学 工作 ,提高 教学 质量 的 若干 意 
见 ) 精 神 ,紧密 配合 教育 部 已 经 启动 的 “高 等 学 校 教学 质量 与 教学 改革 工程 精品 课程 建设 工 
作 ”, 在 有 关 专 家 、 教 授 的 倡议 和 有 关 部 门 的 大 力 支持 下 ,我 们 组 织 并 成 立 了 “清华 大 学 出 版 
社 教材 编审 委员 会 "(以 下 简称 * 编 委 会 ”) , 旨 在 配合 教育 部 制定 精品 课程 教材 的 出 版 规划 ， 
讨论 并 实施 精品 课程 教材 的 编写 与 出 版 工作 。“ 编 委 会 成 员 皆 来 自 全 国 各 类 高 等 学 校 教学 
与 科研 第 一 线 的 骨干 教师 ,其 中 许多 教师 为 各 校 相关 院 、 系 主管 教学 的 院 长 或 系 主任 。 

按照 教育 部 的 要 求 ,“ 编 委 会 ”一 致 认为 .精品 课程 的 建设 工作 从 开始 就 要 坚持 高 标准 、 
严 要 求 ,处 于 一 个 比较 高 的 起 点 上 。 精 品 课程 教材 应 该 能 够 反映 各 高 校 教学 改革 与 课程 建 
设 的 需要 ,要 有 特色 风格 有 创新 性 (新 体系 、 新 内 容 、 新 手段 .新 思路 ,教材 的 内 容 体系 有 和 较 
高 的 科学 创新 ,技术 创新 和 理念 创新 的 含量 )、 先 进 性 (对 原 有 的 学 科 体系 有 实质 性 的 改革 和 
发 展 ,顺应 并 符合 21 世纪 教学 发 展 的 规律 ,代表 并 引领 课程 发 展 的 趋势 和 方向 ) 、 示 范 性 ( 教 
材 所 体现 的 课程 体系 具有 较 广 泛 的 辐射 性 和 示范 性 ) 和 一 定 的 前 脆性。 教材 由 个 人 申报 或 
各 校 推荐 (通过 所 在 高 校 的 “ 编 委 会 "成员 推 荐 ) ,经 “ 编 委 会 ”认真 评审 ,最 后 由 清华 大 学 出 版 
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社 审 定 出 版 。 
目前 ,针对 计算 机 类 和 电子 信息 类 相关 专业 成 立 了 两 个 “ 编 委 会 ”, 即 “清华 大 学 出 版 社 
计算 机 教材 编审 委员 会 "和 “清华 大 学 出 版 社 电子 信息 教材 编审 委员 会 "。 推 出 的 特色 精品 


教材 包括 : 

(1) 21 世纪 高 等 学 校规 划 教材 。 计算 机 应 用 一 一 高 等 学 校 各 类 专业 ,特别 是 非 计算 机 
专业 的 计算 机 应 用 类 教材 。 

(2) 21 世纪 高 等 学 校规 划 教材 。 计算 机 科学 与 技术 一 一 高 等 学 校 计算 机 相关 专业 的 
教材 。 


(3) 21 世纪 高 等 学 校规 划 教材 "电子 信息 一 一 高 等 学 校 电 子 信息 相关 专业 的 教材 。 
(4) 21 世纪 高 等 学 校规 划 教材 。 软件 工程 一 一 高 等 学 校 软件 工程 相关 专业 的 教材 。 
(5) 21 世纪 高 等 学 校规 划 教材 。 信息 管理 与 信息 系统 。 

(6) 21 世纪 高 等 学 校规 划 教材 。 财经 管理 与 应 用 。 

(7) 21 世纪 高 等 学 校规 划 教材 。 电子 商务 。 

(8) 21 世纪 高 等 学 校规 划 教材 。 物 联 网 。 


清华 大 学 出 版 社 经 过 三 十 多 年 的 努力 ,在 教材 尤其 是 计算 机 和 电子 信息 类 专业 教材 出 
版 方面 树立 了 权威 品牌 ,为 我 国 的 高 等 教育 事业 做 出 了 重要 页 献 。 清 华 版 教材 形成 了 技术 
准确 、 内 容 严谨 的 独特 风格 ,这 种 风格 将 延续 并 反映 在 特色 精品 教材 的 建设 中 。 


清华 大 学 出 版 社 教材 编审 委员 会 
联系 人 : 魏 江 江 


E-mail: weijj(@tup. tsinghua. edu. cn 





随 着 计算 机 技术 的 发 展 及 应 用 的 普及 ,计算 机 操作 系统 也 在 不 断 发 展 。 本 书 结合 国内 
各 高 校 研 究 生 招生 考试 的 要 求 及 操作 系统 最 新 发 展 技术 ,在 第 1 版 的 基础 上 进行 了 修订 ,在 
部 分 内 容 上 增加 了 更 加 细致 的 描述 ,增加 了 最 新 技术 的 介绍 。 

为 了 做 到 理论 与 实践 相 结合 ,突出 操作 系统 各 主要 部 分 关键 环节 的 概念 功能、 原理 和 
方法 ,本 书 选 择 当 前 较为 流行 且 有 代表 性 的 操作 系统 一 一 Linux, 深 入 分 析 和 讲解 了 它 的 部 
分 关键 环节 的 实现 技术 。 此 外 ,由 于 操作 系统 所 涉及 的 原理 与 算法 比较 抽象 ,难以 理解 和 掌 
握 , 笔 者 根据 多 年 的 教学 经 验 , 将 一 些 典 型 实例 引入 本 书 , 使 读者 通过 实例 充分 掌握 操作 系 
统 的 原理 与 算法 思想 ,提高 分 析 问 题解 决 问题 的 能 力 。 考 虑 到 近年 来 操作 系统 在 技术 与 应 
用 上 都 有 了 一 些 较 新 的 发 展 ,本 书 引入 了 线程 、 实 时 调度 ` 多 处 理 机 、 嵌 入 式 操作 系统 、 操 作 
系统 安全 技术 等 新 技术 的 介绍 。 

本 书 共 10 章 。 第 1 章 为 绪论 ,从 操作 系统 的 发 展 和 作用 引入 操作 系统 的 概念 ,简要 介 
绍 操作 系统 的 功能 ,同时 依据 操作 系统 的 不 同 设计 目标 对 操作 系统 进行 分 类 介绍 ,描述 
Linux 内 核 结构 及 各 个 功能 模块 的 关联 程度 ; 第 2 章 为 用 户 接 口 ,介绍 操作 系统 的 两 种 用 户 
接口 ,重点 介绍 Linux 常用 操作 命令 和 系统 调用 的 实现 原理 ; 第 3 章 为 进程 管理 ,从 单 道 程 
序 和 多 道 程序 执行 的 不 同 特征 引入 进程 的 概念 ,而 后 介绍 进程 的 基本 特征 和 运行 状态 及 操 
作 系 统 对 进程 的 控制 机 构 , 通 过 实例 分 析 进 程 的 同步 与 互 斥 关 系 的 解决 方法 以 及 进程 通信 
的 常用 方式 ,然后 介绍 线程 的 概念 和 应 用 环境 ,最 后 从 Linux 的 进程 管理 结构 入 手 , 介 绍 
Linux 进程 管理 实现 技术 ; 第 4 章 为 处 理 机 调度 与 死 锁 ,介绍 处 理 机 调度 级 别 与 常用 调度 算 
法 的 基本 思想 ,并 通过 实例 对 不 同 的 算法 进行 优 劣 比较 ,包括 进程 调度 、 实 时 调度 和 多 处 理 
机 调度 ,介绍 Linux 近年 来 在 进程 调度 算法 上 的 演进 过 程 ; 第 5 章 为 存储 管理 ,从 存储 管理 
的 内 存 分 配 、 地 址 变换 、 内 存 扩充 与 内 存 保护 4 个 方面 分 别 介绍 分 区 式 管理 、 页 式 管理 、 段 式 
管理 与 段 页 式 管理 4 种 常用 的 存储 管理 方案 ,介绍 Linux 虚 存 与 内 存 之 间 的 关系 和 实现 中 
用 到 的 数据 结构 ; 第 6 章 为 设备 管理 ,由 低 到 高 逐 层 介绍 1/O 系统 的 层次 结构 中 的 一 些 关 
键 技术 以 及 Linux 存储 管理 采用 的 模块 化 技术 ; 第 7 章 为 文件 管理 ,主要 讲述 文件 与 文件 
系统 、 文 件 的 组 织 和 存 取 以 及 文件 的 保护 ,介绍 Linux 的 文件 管理 中 的 目录 结构 和 文件 操 
作 ; 第 8 章 为 多 处 理 机 系统 ,从 多 处 理 机 概述 引入 多 处 理 机 操作 系统 和 多 计算 机 系统 的 调 
度 及 虚拟 化 实现 技术 ; 第 9 章 为 嵌入 式 操 作 系统 ,介绍 嵌入 式 操 作 系统 的 特点 、 功 能 及 应 用 
领域 ,说 入 式 操作 系统 的 任务 管理 ,内 存 管理 及 时 钟 管理 技术 ; 第 10 章 为 操作 系统 安全 ,对 
计算 机 系统 安全 作 概 要 介绍 ,重点 介绍 操作 系统 安全 机 制 。 

本 教材 具有 如 下 特色 : 

(1) 内 容 全 面 ,结构 清晰 。 本 书 融 当 前 的 主流 操作 系统 于 一 体 , 既 有 操作 系统 的 常用 原 
理 介绍 ,又 有 具体 实现 技术 的 详细 分 析 , 从 而 使 读者 较 好 地 掌握 各 种 常用 操作 系统 的 基本 理 
论 和 实用 技术 。 教 材 内 容 结构 根据 操作 系统 的 五 大 功能 设计 ,使 学 生 对 所 学 内 容 一 目 了 然 ， 
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并 能 分 类 分 层 掌握 。 

(2) 富有 启发 性 。 采 用 ”实例 引导 ,任务 驱动 ”的 编写 方式 ,增加 实例 分 析 , 使 读者 掌握 
操作 系统 实例 的 解析 方法 ,激发 读者 的 学 习 兴 趣 ,充分 理解 所 学 知识 。 

(3) 图 文 并 茂 。 对 于 较 深 奥 的 理论 知识 ,尽量 以 图 示 的 形式 来 说 明 , 便 于 读者 理解 和 
掌握 。 
(4) 理论 联系 实际 。 既 重视 原理 、 概 念 的 讲解 ,也 重视 具体 实现 源 代码 的 分 析 , 通 过 分 
析 当 前 流行 的 Linux 操作 系统 的 实现 技术 和 方法 ,将 抽象 的 原理 和 有 具体 实例 相 结合 ,使 读者 
能 够 在 实际 应 用 中 更 好 地 建立 自己 的 应 用 系统 ,开发 自己 的 应 用 软件 。 
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a 和 wD 





绪论 | 


操作 系统 (Operating System,OS) 是 每 台 计 算 机 必须 安装 的 最 基本 的 系统 软件 , 它 为 操 
纵 硬 件 和 执行 程序 建立 一 个 更 实用 的 系统 平台 。 本 章 首先 介绍 操作 系统 基本 概念 及 在 学 习 
操作 系统 中 涉及 的 计算 机 基本 概念 ; 接着 介绍 操作 系统 的 发 展 过 程 , 旨 在 通过 操作 系统 的 
演变 过 程 对 操作 系统 的 基本 概念 有 进一步 的 揭示 ; 接 下 来 介绍 操作 系统 的 基本 功能 、 基 本 
特征 以 及 体系 结构 。 


(Ga 什么 是 操作 系统 


没有 装 入 任何 软件 的 计算 机 称 为 裸 机 , 裸 机 只 提供 了 计算 机 系统 的 物质 基础 ,属于 计算 
机 硬件 部 分 ,这 时 的 计算 机 不 能 上 网 ,不 能 编程 序 , 也 不 能 帮助 我 们 处 理 图 片 。 对 于 一 台 
的 计算 机 ,要 做 的 第 一 件 事 就 是 装 入 操作 系统 ,一 般 而 言 大 多 数 人 都 会 选择 Windows 或 
Linux。 如 果 不 装 人 操作 系统 ,即使 是 顶尖 的 计算 机 好 手 也 无 法 让 计算 机 完成 我 们 所 要 做 
的 工作 ,这 就 是 操作 系统 的 作用 所 在 。 


1.1.1 程序 是 如 何 运 行 的 


当 一 台 计 算 机 加 电 后 就 会 启动 ,启动 过 程 中 首先 会 装载 操作 系统 ,然后 运行 用 户 想 要 运 
行 的 程序 ,为 用 户 提供 服务 。 专 业 的 计算 机 人 员 应 
该 知道 程序 是 如 何在 计算 机 中 运行 的 ,以 便 更 好 地 ye yw 


接 
控制 和 管理 自己 的 程序 。 图 1-1 为 程序 的 执行 
过 程 。 可 执行 程序 

+ 、 内 存 ) 


首先 ,程序 员 使 用 程序 设计 语言 编写 好 要 实现 操作 系统 ( 装 入 、 文件、 内存 ) 。| 
某 项 功能 的 程序 ,然后 将 其 编译 成 计算 机 能 够 识别 [WE | 
的 机 器 语言 程序 ,再 由 操作 系统 将 其 从 外 存 加 载 到 a 
内 存 中 ,形成 一 个 运行 中 的 程序 。 程 序 要 得 到 执 一 一 
行 , 还 要 通过 操作 系统 的 调度 将 其 送 入 CPU ,计算 执行 程序 
机 执行 程序 时 逐条 执行 程序 中 的 指令 ,整个 程序 的 操作 系统 (文件 、1/0) 
执行 过 程 还 需要 操作 系统 提供 的 服务 ,如 输入 输出 | 
数据 .磁盘 服务 等 。 最 后 ,通过 操作 系统 提供 的 接 


口 将 程序 的 运行 结果 返回 给 用 户 。 图 1-1 程序 的 执行 过 程 


高 级 语言 编写 的 程序 
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1.1.2 操作 系统 的 作用 


使 用 计算 机 的 目的 是 方便 、 快 捷 、 有 效 地 工作 。 计 算 机 的 工作 过 程 就 是 执行 指令 的 过 
程 ,而 计算 机 执行 指令 的 过 程 可 看 成 是 控制 信息 在 计算 机 各 组 成 部 件 之 间 的 有 序 流动 过 程 ， 
信息 在 流动 过 程 中 得 到 相关 部 件 的 加 工 处理 。 而 要 有 条 不 亲 地 控制 大 量 信 息 在 计算 机 各 部 
件 之 间 有 序 地 流动 ,又 能 方便 用 户 使 用 ,需要 一 个 专门 的 系统 去 管理 和 控制 这 些 部 件 及 信 
息 , 这 一 系统 就 是 操作 系统 。 

正 是 操作 系统 把 一 台 裸 机 变 成 一 台 可 操作 的 、 方 便 灵活 的 机 器 ,计算 机 加 操作 系统 通常 
称 为 虚拟 机 (virtual machine) 或 扩展 机 (extended machine)。 而 各 种 实用 程序 和 应 用 程序 
运行 在 操作 系统 之 上 ,它们 以 操作 系统 作为 支撑 环境 ,向 用 户 提供 完成 其 任务 所 需要 的 各 种 
服务 。 在 一 般 情 况 下 ,实际 呈现 在 用 户 面前 的 计算 机 系统 已 是 经 过 若干 层次 软件 改造 的 计 
算 机 ,也 就 是 装 入 了 各 种 应 用 软件 的 计算 机 。 

如 图 1-2 所 示 , 可 把 整个 系统 按 功能 划分 为 4 个 层次 , 即 硬件 .操作 系统 .系统 实用 软件 
和 应 用 软件 。 这 个 层次 表现 为 一 种 单 向 的 服务 关系 , 即 外 层 可 以 使 用 内 层 提供 的 服务 ,反之 
则 不 行 。 在 这 个 层次 结构 中 ,包围 着 系统 硬件 的 一 层 是 操作 系统 , 它 是 最 基本 的 系统 软件 ， 
控制 和 管理 着 系统 的 硬件 ,向 上 层 的 系统 实用 软件 和 应 用 软件 提供 一 个 屏蔽 硬件 工作 细节 
的 良好 使 用 环境 ,通过 系统 核心 程序 对 系统 中 的 资源 进行 管理 ,通过 这 些 服务 将 对 所 有 硬件 
的 复杂 操作 隐藏 起 来 ,为 用 户 提供 一 个 透明 的 操作 环境 。 









应 用 软件 
系统 实用 软件 


操作 系统 


系统 维护 程序 


事务 处 理 系统 


图 1-2 计算 机 系统 层次 结构 


当 一 台 计 算 机 有 多 个 用 户 时 ,因为 用 户 间 可 能 相互 影响 ,所 以 需要 管理 和 保护 存储 器 、 
1/O 设备 以 及 其 他 设备 。 用 户 往往 不 仅 需 要 共享 硬件 ,还 要 共享 信息 (文件 数据 库 等 ) ,此 
时 操作 系统 的 首要 任务 是 跟踪 资源 的 使 用 状况 ,满足 资源 请 求 ,提高 资源 利用 率 , 协 调 各 程 
序 和 用 户 使 用 资源 的 冲突 。 

因此 ,操作 系统 的 作用 可 以 归纳 为 3 点 : 

(1) 管理 系统 资源 。 

众所周知 ,计算 机 系统 资源 包括 两 大 类 : 硬件 资源 和 软件 资源 。 硬 件 资源 通常 包括 处 


理 器 (CPU) . 主 存 、 输 入 输出 (IO) 设 备 ; 软件 资源 包括 计算 机 系统 中 的 各 类 文件 。 相 应 地 ， 
操作 系统 的 主要 功能 也 正 是 针对 这 些 资源 进行 有 效 的 管理 。 

(2) 为 用 户 提供 一 个 良好 的 接口 。 

操作 系统 是 计算 机 与 用 户 之 间 的 接口 ,操作 系统 为 用 户 提供 了 良好 的 操作 界面 ,以 使 用 
户 无 须 了 解 硬件 和 系统 软件 的 细节 ,就 能 方便 灵活 地 使 用 计算 机 。 

(3) 最 大 限度 地 提高 系统 资源 使 用 效率 

当 多 个 用 户 共享 系统 资源 时 ,不 可 避免 地 会 出 现 多 个 用 户 竞争 资源 。 操 作 系 统 能 够 合 
理 地 为 用 户 分 配 资源 ,合理 地 组 织 计 算 机 的 工作 流程 ,提高 资源 的 利用 率 和 系统 的 吞吐 量 。 

综 上 所 述 ,我 们 可 以 给 操作 系统 下 一 个 定义 : 操作 系统 是 直接 控制 和 管理 计算 机 软 硬 
件 资源 的 最 基本 的 系统 软件 , 它 可 以 合理 地 组 织 计 算 机 的 工作 流程 ,以 方便 用 户 充分 有 效 
地 利用 这 些 资源 ,并 增强 整个 计算 机 的 处 理 能 力 。 


(2 操作 系统 运行 环境 


操作 系统 是 一 个 运行 于 硬件 之 上 的 系统 软件 , 它 和 硬件 有 密切 的 联系 。 为 了 更 好 地 理 
解 操作 系统 的 工作 原理 ,本 节 简 要 回顾 现代 个 人 计算 机 中 与 操作 系统 相关 的 基本 硬件 技术 
和 概念 。 


1.2.1 计算 机 的 基本 硬件 元 素 


构成 现代 个 人 计算 机 的 基本 硬件 元 素 包括 处 理 器 、 存 储 器 、 输 入 输出 控制 器 .总 线 、 外 部 
设备 等 ,这 些 基 本 元 素 的 迎 辑 关系 如 图 1-3 所 示 。 
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py PC : 程序 计数 器 
IR_ | LMBR | 总 线 | 天 据 | IR: 指令 寄存 器 
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1-3 计算 机 的 基本 硬件 元 素 


处 理 器 控制 和 执行 计算 机 的 指令 ,一 台 计 算 机 中 可 以 有 多 个 处 理 器 ,也 可 以 只 有 一 个 处 
理 器 。 多 处 理 器 和 单 处 理 器 的 计算 机 操作 系统 在 设计 和 功能 上 都 有 较 大 区 别 , 本 书 主要 讨 
论 单 处 理 器 的 操作 系统 。 

存储 器 用 来 存储 数据 和 程序 。 存 储 器 可 分 为 内 存 、 外 存 以 及 用 于 暂时 存储 数据 和 程序 
的 缓冲 器 与 高 速 缓存 (cache) 等 。 

输入 输出 控制 器 主要 用 来 控制 和 暂时 存储 外 部 设备 与 计算 机 内 存 之 间 交 换 的 数据 和 
程序 。 
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外 部 设备 范围 很 广 ,它们 是 获取 和 输出 数据 与 程序 的 基本 设备 ,包括 数字 设备 和 模拟 设 
备 。 不 过 ,模拟 设备 要 通过 模 / 数 转 换 后 才能 把 模拟 信号 输入 到 计算 机 ,而 计算 机 输出 的 数 
字 信 号 则 要 通过 数 / 模 转换 后 才能 在 模拟 设备 上 显示 或 输出 。 

计算 机 系统 的 各 种 设备 通过 总 线 互相 连接 。 总 线 是 连接 计算 机 各 部 件 的 通信 线路 。 计 
算 机 系统 的 总 线 有 单 总 线 和 多 总 线 之 分 。 单 总 线 是 指 将 处 理 机 、 外 部 设备 ,存储 器 等 连接 在 
一 起 的 总 线 结构 ,而 多 总 线 则 是 指 把 系统 的 CPU 和 内 存 分 开 连 接 , 外 部 设备 和 外 存 等 也 用 
其 他 总 线 分 开 连 接 , 分 别 进 行 管理 和 数据 传送 的 总 线 结构 。 显 然 , 不 同 的 总 线 结构 对 操作 系 
统 的 设计 和 性 能 有 不 同 的 影响 。 


1.2.2 与 操作 系统 相关 的 几 种 主要 寄存 器 


寄存 器 与 操作 系统 密切 相关 ,是 在 处 理 机 中 交换 数据 的 速度 比 内 存 更 快 ,体积 更 小 、 价 
格 更 贵 的 暂 存 器 件 。 与 操作 系统 相关 的 典型 寄存 器 包括 以 下 几 种 。 


1. 数据 寄存 器 


编程 人 员 可 以 通过 程序 赋予 数据 寄存 器 众多 的 功能 。 一 般 来 说 ,对 数据 进行 操作 的 任 
何 机 器 指令 都 被 允许 访问 数据 寄存 器 。 不 过 ,根据 硬件 设置 的 规定 ,这 些 寄存 器 也 可 能 只 被 
允许 进行 浮 点 运算 ,或 者 受到 其 他 规定 的 限制 。 


2. 地 址 寄存 器 


地 址 寄存 器 一 般 用 来 存放 内 存 中 某 个 数据 或 指令 的 地 址 ,或 者 存放 某 段 数据 与 指令 的 
入 口 地 址 ,以 及 用 来 进行 更 复杂 的 地 址 计算 。 下 面 几 种 寄存 器 都 是 地 址 寄存 器 : 

。 地 址 标志 位 寄存 器 。 

。 内 存 管 理 用 各 种 始 地 址 寄存 器 。 

。 堆栈 指针 。 

。 设备 地 址 寄存 器 等 。 


3. 条 件 码 寄 存 器 


条 件 码 寄存 器 也 称 标志 寄存 器 ,其 标志 位 由 处 理 机 硬件 设置 。 例 如 ,一 次 算术 运算 可 能 
导致 条 件 码 寄存 器 被 设置 为 正 、 负 、 零 或 溢出 。 


4. 程序 计数 器 

程序 计数 器 (PC) 内 装 有 下 一 周期 被 执行 的 指令 的 地 址 。 
5. 指令 寄存 器 

指令 寄存 器 (IR) 内 装 有 待 执行 指令 。 

6. 程序 状态 字 寄 存 器 


程序 状态 字 (PSW) 寄 存 器 的 各 个 位 代表 系统 中 当前 的 各 种 不 同 状态 与 信息 ,例如 CPU 
优先 级 .用 户 态 或 核心 态 以 及 执行 模式 是 否 允 许 中 断 等 。 


7. 中 断 现 场 保护 寄存 器 


如 果 系 统 允 许 不 同类 型 的 中 断 存 在 , 则 会 设置 一 组 中 断 现 场 保护 寄存 器 以 便 保 存 被 中 
断 程序 的 现场 和 链接 中 断 恢复 处 。 


8. 堆栈 


堆栈 用 来 存放 过 程 调用 时 的 调用 名 、 调 用 参数 以 及 返回 地 址 等 。 

寄存 器 广泛 应 用 于 计算 机 系统 中 ,与 操作 系统 有 着 非常 直接 和 密切 的 关系 。 事 实 上 , 操 
作 系 统 设 计 人 员 只 有 完全 掌握 和 了 解 硬件 厂商 所 提供 的 各 种 寄存 器 的 功能 和 接口 ,才能 进 
行 操作 系统 设计 。 


1.2.3 指令 的 执行 


每 个 CPU 都 有 一 个 指令 集合 。 任 何 应 用 程序 的 运行 都 是 通过 指令 的 执行 才 得 以 实现 
的 。 执 行 指令 的 基本 过 程 分 为 两 步 , 即 处 理 机 从 内 存 读 入 指令 的 过 程 和 执行 的 过 程 。 其 中 ， 
读 入 的 指令 保存 在 程序 计数 器 所 指 的 地 址 ,而 执行 的 指令 则 保存 在 指令 寄存 器 中 。 

我 们 把 指令 的 读 人 和 执行 过 程 称 为 一 个 执行 周期 ,如 图 1-4 所 示 。 指 令 的 执行 涉及 处 
理 机 与 内 存 之 间 的 数据 传输 或 者 处 理 机 与 外 部 设备 之 间 的 数据 传输 等 。 指 令 的 执行 也 涉及 
数据 处 理 , 例 如 算术 运算 或 逮 辑 运 算 。 另 外 ,指令 的 执行 还 可 以 是 对 其 他 指令 的 控制 过 程 。 
一 条 指令 的 执行 可 以 是 上 述 几 种 情况 的 组 合 。 











执行 当 前 
人 





图 1-4 指令 的 执行 周期 


1.2.4 中 断 
1. 中 断 的 概念 


在 日 常生 活 中 ,经 常会 发 生 这 种 情况 , 当 你 正在 做 某 件 事 时 ,发 生 了 另外 一 件 需要 你 去 处 
理 的 紧急 事件 。 这 时 你 只 能 暂时 放下 前 者 ,去 处 理 后 者 , 待 处 理 完成 后 ,再 继续 做 原先 的 事 。 

计算 机 系统 中 的 中 断 概念 与 之 类 似 。 所 谓 中 断 ,是 指 当 CPU 正在 执行 某 一 程序 时 ,发 
生 了 异步 事件 ,此 时 CPU 将 打 断 正在 执行 的 程序 ( 称 为 现行 程序 ) , 转 去 执行 一 段 处 理 该 事 
件 的 有 关 程 序 。 被 打 断 的 程序 可 以 在 以 后 的 某 个 时 间 继 续 执行 。 中 断 的 特点 是 具有 随机 
性 ,发 生 中 断 的 时 间或 原因 与 现行 程序 没有 逮 辑 上 
的 关系 。 这 就 必须 保证 现行 程序 被 中 断后 能 在 以 后 
继续 正确 地 执行 。 图 1-5 是 中 断 的 执行 过 程 。 i | 

引起 中 断 的 事件 称 为 中 断 源 , 中 断 源 向 CPU 发 指令 +1 人] | 处理 程序 
出 的 请 求 处 理 信和 号称 为 中 断 请 求 ,发 生 中 断 时 的 现 : 
行程 序 的 暂停 点 称 为 中 断 点 ,CPU 暂停 现行 程序 转 
去 响应 中 断 请 求 的 过 程 称 为 中 断 响应 ,处 理 中 断 源 图 1-5 中 断 的 执行 过 程 
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的 程序 称 为 中 断 处 理 程序 ,CPU 执行 相关 中 断 处 理 程序 的 过 程 称 为 中 断 处 理 过 程 ,而 返回 
断 点 的 过 程 称 为 中 断 返 回 。 

在 某 些 情况 下 ,尽管 产生 了 中 断 请 求 ,但 CPU 内 部 的 程序 状态 字 PSW 中 的 中 断 允 许 
位 已 被 清除 ,从 而 不 允许 CPU 响应 中 断 , 这 种 情况 称 为 禁止 中 断 , 也 称 为 关中 断 。CPU 禁 
止 中 断后 ,只 有 等 到 程序 状态 字 中 的 中 断 允 许 位 被 重新 设置 后 才能 接收 中 断 ,这 一 过 程 称 为 
开 中 断 。 关 中 断 和 开 中 断 都 是 由 硬件 实现 的 。 


2. 中 断 类 型 与 中 断 优先 级 


根据 中 断 源 产生 的 条 件 , 可 把 中 断 分 为 内 中 断 和 外 中 断 。 

外 中 断 指 来 自 处 理 机 和 内 存 外 部 的 中 断 ,包括 I/O 设备 发 出 的 中 断 、 外 部 信号 中 断 、 各 
种 定时 器 引起 的 时 钟 中 断 以 及 调试 程序 中 设置 的 断 点 等 引起 的 调试 中 断 。 

内 中 断 主 要 指 在 处 理 机 和 内 存 中 产生 的 中 断 。 内 中 断 也 称 为 陷入 。 它 包括 程序 运算 时 
引起 的 各 种 错误 ,如 地 址 非法 .数据 溢出 .用 户 执行 特权 指令 、 分 时 系统 的 时 间 片 中 断 以 及 从 
用 户 态 到 核心 态 的 切换 等 。 

根据 系统 对 中 断 处理 的 需要 ,操作 系统 一 般 对 各 种 中 断 赋予 不 同 的 处 理 优先 级 ,以 便 在 
不 同 的 中 断 同时 发 生 时 按 轻 重 缓急 进行 处 理 。 各 中 断 源 的 优先 级 在 系统 设计 时 给 定 , 在 系 
统 运 行 时 是 固定 的 。 


3. 中 断 响应 与 中 断 处 理 
中 断 响应 只 能 发 生 在 两 条 相继 机 器 指令 执行 的 间隙 ,如 图 1-6 所 示 。 


读 和 中断 

处 理 指令 
有 陵 和 下 一 多 | 执行 
开始 站 令 当前 指令 > 


图 1-6 中 断 处 理 时 的 指令 执行 周期 





















检查 
中 断 位 























每 当 CPU 执行 完成 一 条 指令 , 便 立 即 查询 有 无 中 断 请 求 。 若 无 , 则 继续 执行 下 一 条 指 
令 ; 若 有 , 则 转 和 人 相应 的 中 断 处 理 程序 。 

系统 一 旦 响应 中 断 , 便 开始 中 断 处 理 过 程 。 它 的 主要 工作 是 保护 被 中 断 程序 的 现场 ,以 
便 以 后 可 以 恢复 现场 ,使 现行 程序 能 得 到 正确 的 执行 ,然后 转 去 执行 相应 的 中 断 处 理 程序 。 
系统 为 每 类 中 断 源 都 预先 安排 好 了 中 断 处 理 程序 , 它 的 入 口 地 址 存 于 固定 的 存储 单元 中 。 


1.2.5 处 理 机 状态 及 特权 指令 
1. 处 理 机 的 状态 
在 计算 机 系统 中 有 两 类 程序 在 运行 : 用 户 程序 和 系统 程序 。 用 户 程序 和 系统 程序 在 执 


行 时 有 不 同 的 权限 。 

根据 对 系统 资源 和 机 器 指令 的 使 用 权限 ,把 处 理 机 执行 时 的 工作 状态 分 为 系统 态 和 用 
户 态 。 有 的 操作 系统 还 将 系统 程序 执行 时 机 器 的 状态 又 分 为 核 态 和 管 态 ,其 权限 由 高 到 低 

核 态 (kernel mode) 是 CPU 执行 操作 系统 程序 时 所 处 的 状态 。 在 此 状态 下 允许 CPU 
使 用 全 部 资源 和 全 部 指令 ,其 中 包括 一 组 特权 指令 (如 涉及 外 设 的 IO\ 改 变 处 理 机 状态 、 修 
改 存储 保护 的 指令 ) ,实现 对 系统 资源 的 分 配 与 管理 ,为 用 户 提供 使 用 外 部 设备 的 服务 。 

管 态 (supervisor mode) 比 核 态 的 权限 低 ,在 此 状态 下 允许 使 用 一 些 用 户 态 下 不 能 使 用 
的 资源 ,但 不 能 使 用 修改 CPU 状态 的 指令 。 

用 户 态 (user mode) 是 用 户 程序 执行 时 CPU 所 处 的 状态 。 在 此 状态 下 禁止 使 用 特权 指 
令 ,不 能 直接 使 用 系统 资源 以 及 改变 CPU 状态 ,并且 只 能 访问 用 户 程序 所 在 的 存储 空间 。 

当 CPU 执行 用 户 程序 时 ,CPU 处 于 用 户 态 ; 在 执行 的 过 程 中 出 现 中 断 (或 陷入 ) 时 , 系 
统 转 去 处 理 与 中 断 有 关 的 事件 ,这 时 CPU 由 用 户 态 转 换 成 核 态 ( 或 管 态 ); 处 理 完 中 断后 ， 
返回 断 点 继续 执行 用 户 程 序 ,这 时 CPU 由 核 态 转换 成 用 户 态 。 


2. 特权 指令 集 


在 核 态 下 操作 系统 可 以 使 用 所 有 指令 ,包括 一 组 特权 指令 : 
。 允许 和 禁止 中 断 。 

。 在 进程 之 间 切 换 处 理 机 。 

。 存 取 用 于 内 存 保护 的 寄存 器 。 

。 执 行 输入 输出 操作 。 

。 使 CPU 处 于 暂停 状态 。 

在 下 列 情况 下 ,由 用 户 态 转向 核 态 : 

。 用 户 程 序 要 求 操作 系统 服务 ,发生 系统 调用 。 

。 发 生 中 断 。 

。 用 户 程序 产生 了 错误 的 状态 。 

。 用 户 程序 企图 执行 一 条 特权 指令 。 

从 核 态 转 回 用 户 态 用 一 条 指令 实现 ,这 条 指令 也 是 特权 指令 ,一 般 情 况 下 是 中 断 返 回 


指令 。 
(3 操作 系统 的 形成 和 发 展 


为 了 更 好 地 理解 操作 系统 的 基本 概念 和 功能 ,本 节 回 顾 操作 系统 的 形成 和 发 展 过 程 。 

一 个 事物 的 产生 总 有 其 原因 和 必然 性 ,操作 系统 也 不 例外 。 操 作 系统 是 伴随 着 计算 机 
的 产生 而 产生 ,并 且 随 着 计算 机 技术 及 其 应 用 的 发 展 而 不 断 发 展 和 完善 的 。 计 算 机 硬件 经 
历 了 电子 管 .晶体 管 集 成 电路 、 大 规模 和 超大 规模 集成 电路 的 发 展 历 程 ,操作 系统 也 完成 了 
从 无 到 有 、 从 简单 到 复杂 的 演变 过 程 。 根 据 硬件 结构 和 应 用 环境 ,可 以 将 操作 系统 的 发 展 划 
分 为 以 下 几 个 阶段 : 手工 操作 、 批 处 理 系 统 、 多 道 程序 系统 、 现 代 操作 系统 。 
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1.3.1 操作 系统 发 展 的 基础 
1. 计算 机 体系 结构 的 发 展 


计算 机 体系 结构 经 历 了 从 简单 到 复杂 、 从 单机 到 多 机 、 从 集中 到 分 散 的 发 展 , 它 所 依赖 
的 物质 基础 是 微 电 子 技术 和 超大 规模 集成 技术 ,硬件 资源 的 发 展 促进 了 计算 机 体系 结构 的 

计算 机 体系 结构 的 发 展 给 各 种 硬件 资源 管理 提出 了 更 高 的 要 求 , 而 对 系统 各 部 分 (1/O 
系统 .主机 系统 、 存 储 子 系统 、 网 络 子 系统 ) 进 行人 工 管理 是 不 可 能 的 ,因此 需要 有 一 个 超 强 
功能 的 软件 来 组 织 和 统一 协调 各 个 部 件 的 工作 ,这 个 软件 就 是 操作 系统 。 


2. 计算 机 软件 资源 的 发 展 


软件 的 发 展 有 两 个 重要 的 方面 : 一 是 支持 用 户 进行 系统 开发 ; 二 是 增强 系统 的 管理 和 
服务 能 力 。 计 算 机 高 级 语言 及 其 编译 系统 的 发 展 打 开 了 应 用 领域 的 大 门 ,推动 了 应 用 系统 
的 开发 , 随 之 而 来 的 各 种 服务 程序 .实用 程序 .工具 程序 .娱乐 程序 使 计算 机 系统 资源 的 概念 
发 生 了 变化 ,不 仅 指 硬件 资源 ,还 包括 上 述 各 类 软件 .数据库 和 文档 信息 等 ,这 就 是 软件 资 
源 。 对 软件 资源 的 管理 和 支持 也 是 操作 系统 的 任务 。 


3. 应 用 环境 与 需求 的 发 展 


随 着 应 用 领域 的 扩大 和 深入 ,用 户 对 计算 机 系统 的 要 求 也 在 改变 。 一 般 来 说 ,用 户 希 望 
系统 的 功能 越 强 越 好 ,系统 的 接口 尽 可 能 简单 ,速度 尽 可 能 快 ,最 好 能 共享 各 种 系统 资源 ,有 
较 高 的 可 靠 性 和 有 效 性 ,并 且 能 按 用 户 的 需求 重新 组 织 或 扩充 等 。 而 上 述 需 求 仍然 在 不 断 
地 变化 ,从 而 也 促进 了 操作 系统 的 发 展 。 


1.3.2 手工 操作 


在 20 世纪 40 年 代 中 期 ,数学 家 冯 “。 诺 依 曼 (John von Neumann) 提 出 了 程序 的 概念 ， 
设计 并 建造 了 电子 管 数字 计算 机 。 其 主要 特点 是 : 计算 机 的 主要 器 件 是 电子 管 ,以 来 延迟 
线 、 磁 芯 、 磁 环 作为 主 存储 器 ,以 磁 鼓 或 磁带 作为 外 部 存储 器 ,计算 机 总 体 结构 以 运行 器 为 中 
心 。 这 种 计算 机 体积 庞大 , 耗 能 极 高 ,速度 极 慢 , 且 价格 昂贵 。 这 个 时 期 没有 编程 语言 ,上 机 
完全 是 手工 操作 ,操作 系统 尚未 出 现 , 编 程 全 部 采用 机 器 语言 ,通过 一 些 择 板 上 的 硬 连 线 来 
控制 其 基本 功能 。 这 个 时 期 的 计算 机 主要 用 于 数值 计算 。 

这 种 手工 操作 方式 存在 着 明显 的 缺点 : 

(1) 上 机 用 户 独占 全 部 资源 ,其 他 用 户 只 能 等 待 。 

(2) 手工 操作 的 出 错 率 比较 高 。 

(3) 随 着 计算 机 运行 速度 的 提高 ,高速 的 计算 机 与 低速 的 手工 操作 之 间 形 成 矛盾 。 

20 世纪 50 年 代 初期 ,出 现 了 穿孔 卡片 ,这 时 就 可 以 不 用 插 板 。 同 时 期 还 出 现 了 脱 机 的 
输入 输出 技术 ,该 技术 是 指 在 进行 程序 的 调试 与 执行 时 ,程序 员 把 事先 写 有 程序 的 卡片 装 入 
卡片 输入 机 ,在 一 台 外 围 机 的 控制 下 ,把 卡片 上 的 数据 输入 到 磁带 上 , 当 CPU 需要 时 ,再 从 
磁带 上 把 程序 和 数据 送 进 计算 机 ,然后 启动 计算 机 运行 程序 。 当 需要 输出 时 ,可 由 CPU 直 


接 把 数据 送 到 磁带 上 ,再 在 另 一 台 外 围 机 的 控制 下 ,将 磁带 机 上 的 结果 通过 相应 的 输出 设备 
输出 。 由 于 程序 和 数据 的 输入 和 输出 都 是 在 外 围 机 的 控制 下 完成 的 ,或 者 说 它们 是 在 脱离 
主机 的 情况 下 进行 的 , 故 称 为 脱 机 输入 输出 方式 ; 反之 ,在 主机 的 直接 控制 下 进行 输入 输出 
的 方式 称 为 联机 输入 输出 方式 。 


1.3.3 批 处 理 系统 


批 处 理 系统 是 早期 的 大 型 机 使 用 的 操作 系统 。 现 代 操 作 系统 大 都 具有 批 处 理 功能 。 批 
处 理 系统 的 特点 是 采用 脱 机 服务 方式 , 即 用 户 将 控制 作业 的 意图 .数据 以 及 程序 利用 系统 提 
供 的 作业 控制 命令 书写 成 作业 说 明 书 提交 给 操作 员 ,操作 员 将 其 输入 外 存 , 由 操作 系统 控 
制 ,调度 各 作业 的 运行 ,最 后 输出 结果 。 它 是 一 种 非 人 工 的 干预 方式 。 批 处 理 系 统 有 单 道 批 
处 理 系 统 和 多 道 批 处 理 系统 之 分 。 


1. 单 道 批 处 理 系 统 


20 世纪 50 年 代 后 期 ,出 现 了 晶体 管 计算 机 ,计算 机 的 运行 速度 得 到 了 很 大 提高 ,外 部 
存储 设备 除 磁 鼓 、 磁 带 外 ,又 引入 了 磁盘 。 这 个 时 期 的 计算 机 被 称 为 第 二 代 计 算 机 。 在 此 期 
间 ,程序 和 编程 语言 得 到 较 大 的 发 展 。 计 算 机 安装 在 专门 的 机 房 , 有 专人 操作 。 然 而 ,低速 
的 手工 操作 和 高 速 的 计算 机 运行 之 间 的 矛盾 越 来 越 严 重 , 变 得 让 人 无 法 忍受 。 另 外 ,计算 机 
硬件 仍然 十 分 昂贵 ,需要 最 大 限度 地 利用 机 器 资源 。 人 们 为 了 提高 资源 利用 率 ,减少 机 时 的 
浪费 ,提出 了 批 处 理 操作 系统 的 概念 。 

单 道 批 处 理 系 统 的 中 心思 想 是 使 用 一 个 称 为 监控 程序 的 软件 ,通过 这 种 软件 ,用 户 不 再 
直接 访问 计算 机 ,而 是 把 程序 和 数据 以 及 用 户 对 程序 的 控制 意图 写 在 卡片 或 磁带 中 ,以 作业 
的 形式 提交 给 计算 机 操作 员 ,由 操作 员 把 这 些 作业 按 顺 序 组 织 成 一 批 ,并 将 整 批 作业 放 在 输 
人 设备 上 , 供 监 控 程 序 使 用 。 首 先 ,监控 程序 将 磁带 上 的 第 一 个 作业 装 入 内 存 , 该 作业 完成 处 
理 后 返回 到 监控 程序 ,然后 ,监控 程序 自动 加 载 下 一 个 作业 。 在 监控 程序 的 控制 下 ,系统 可 以 
连续 运行 ,一 直到 这 批 作业 处 理 完毕 。 这 样 的 监控 程序 也 就 是 操作 系统 的 锥 形 。 由 于 系统 对 
作业 的 处 理 是 成 批 进行 的 , 且 在 内 存 中 只 能 保持 一 道 作业 运行 , 故 称 之 为 单 道 批 处 理 系统 。 

这 种 监控 程序 可 以 使 作业 间 自 动 切换 ,减少 了 作业 交接 时 间 的 浪费 ,但 是 它 还 没有 真正 
形成 对 作业 的 控制 和 管理 。 如 果 一 个 用 户 的 作业 非常 庞大 , 它 在 运行 期 间 将 独占 计算 机 系 
统 的 所 有 资源 ,在 它 运 行 完成 之 前 ,任何 其 他 用 户 的 作业 ,哪怕 是 很 短 的 作业 也 只 能 等 待 。 

单 道 批 处 理 系统 提高 了 CPU 的 利用 率 , 减 少 了 操作 员 手 工 操作 的 出 错 率 , 比 起 人 工 操 
作 有 了 很 大 的 进步 。 单 道 批 处 理 系统 具有 以 下 几 个 特征 : 

(1) 自动 性 。 如 果 情 况 顺利 ,磁带 上 的 作业 能 够 自动 依次 运行 ,无 须 人 工 干预 。 

(2) 顺序 性 。 磁 带 上 的 各 道 作 业 按照 一 定 的 顺序 进入 内 存 运行 。 

(3) 单 道 性 。 监 控 程 序 每 次 只 从 磁带 上 调 入 一道 作业 进入 内 存 运 行 , 即 同 一 时 刻 内 存 
中 仅 有 一 道 作业 运行 。 

2. 多 道 程序 系统 


20 世纪 60 年 代 初期 ,计算 机 的 应 用 形成 两 个 领域 , 即 面 向 科学 与 工程 的 复杂 计算 和 面 
向 字符 处 理 的 商务 应 用 。 由 此 出 现 了 通用 计算 机 。 这 个 时 期 的 计算 机 被 称 为 第 三 代 计 算 
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机 。 其 主要 特点 是 : 以 中 、 小 规模 集成 电路 作为 逻辑 器 件 , 主 存储 器 除 磁 芯 外 ,开始 使 用 半 
导体 存储 器 ,外 存储 器 则 以 磁盘 为 主 。 著 名 的 IBM Syetem 360 计算 机 是 一 个 代表 , 它 是 第 
一 台 采 用 集成 电路 的 计算 机 , 比 第 二 代 计算 机 有 更 好 的 性 能 价格 比 ,也 是 一 台大 型 通用 计算 
机 。 通 用 计算 机 要 实现 通用 性 ,必须 功能 强大 ,能 够 满足 不 同 应 用 要 求 , 处 理 和 适应 各 种 设 
备 环 境 ,才能 发 挥 最 大 效能 ,所 以 必须 有 一 个 强 有 力 的 、 功 能 复杂 的 监控 程序 来 监管 和 协调 
系统 的 所 有 操作 ,安排 和 调度 用 户 提交 的 作业 ,分 配 系 统 共用 的 各 种 软件 和 硬件 资源 。 最 初 
的 监控 程序 不 能 完成 这 些 功 能 ,由 此 出 现 了 功能 强大 的 程序 集合 , 即 现在 所 说 的 操作 系统 。 

在 IBM System 360 上 运行 的 OS/360 操作 系统 被 认为 是 真正 的 操作 系统 。 因 为 它 实 
现 了 资源 管理 ,建立 了 资源 管理 的 机 制 ,直到 现在 ,许多 操作 系统 中 的 技术 和 结构 还 多 少 留 
有 它 的 影子 。 尽 管 OS/360 存在 较 大 的 隐患 和 不 足 , 但 它 引 入 了 一 种 新 技术 一 一 多 道 程序 
技术 , 即 在 内 存 中 同时 存放 多 个 程序 使 它们 同时 处 于 运行 状态 。 在 单 处 理 机 系统 中 ,多 道 程 
序 技术 的 特点 如 下 : 

(1) 多 道 。 计算 机 内 存 中 同时 存放 多 个 相互 独立 的 程序 。 

(2) 宏观 上 并 行 。 同 时 进入 系统 的 几 个 程序 都 处 于 运行 状态 , 即 它们 都 开始 了 运行 ,但 
都 未 运行 完毕 。 

(3) 微观 上 串 行 。 实 际 上 ,各 个 程序 轮流 使 用 CPU ,交替 执行 。 

图 1-7(a) 是 单 道 程序 运行 的 情况 ,其 中 心 一 sa 和 4 一 2 两 段 时 间 内 处 理 机 在 等 待 。 
图 1-7(b) 是 两 道 程序 运行 的 情况 (假设 A、B 程序 请 求 的 设备 不 同 ) ,其 中 心 一 5 和 太一 说 两 
段 时 间 内 处 理 机 在 等 待 , 但 是 总 一 2 和 太一 两 段 时 间 内 用 户 程序 和 外 设 在 并 行 工作 。 显 
然 ,在 多 道 程序 系统 中 ,CPU 和 外 设 可 以 并 行 运行 ,大 大 提高 了 CPU 的 利用 率 , 从 而 提高 了 
系统 资源 的 利用 率 , 这 正 是 引入 多 道 程序 的 目的 。 
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1-7 单 道 与 两 道 程序 的 运行 情况 


下 面 用 一 个 具体 的 例子 来 说 明 多 道 程序 的 运行 过 程 与 单 道 程 序 的 差别 。 

例 1-1 设 有 A、B、C 3 个 程序 ,其 执行 过 程 分 别 如 下 : 

A: Cu=30ms Ts=40ms Cs 一 10ms 

B: Ca 王 60ms 1»=30ms  C2 一 10ms 

C: Ca 一 20ms Ja 一 40ms Cs 一 20ms 

其 中 ,Ci 表示 内 部 计算 过 程 ,I 表示 1/O 操作 ,3 个 程序 的 优先 权 从 高 到 低 为 A、B、C。 

假设 调度 和 启动 /O 的 执行 时 间 忽略 不 计 , 同 时 假设 每 道 程序 请 求 的 外 设 不 冲突 。 如 
果 是 单 道 程序 系统 ,3 个 程序 顺序 执行 完成 需 多 少时 间 ? 如 果 是 多 道 程 序 系统 ,3 个 程序 同 
时 驻 留 内 存 , 完 成 3 个 程序 执行 共 需 多 少时 间 ? 

解 : 3 个 程序 并 发 执行 时 的 工作 情况 如 图 1-8 所 示 。 其 中 只 画 出 了 3 个 程序 在 CPU 上 
的 执行 情况 ,省 略 了 外 设 的 工作 情况 ,阴影 部 分 是 CPU 的 空闲 时 间 。 
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图 1-8 3 个 程序 的 CPU 执行 情况 


由 图 1-8 可 知 ,3 个 程序 顺序 执行 完成 需 260ms。 如 果 是 多 道 程序 系统 ,3 个 程序 同时 
驻 留 内 存 , 完 成 3 个 程序 共 需 180ms,3 个 程序 在 执行 过 程 中 以 重 释 的 方式 运行 , 比 单 道 程 
序 系统 节 省 了 80ms。 


3. 多 道 批 处 理 系统 


单 道 批 处 理 系统 克服 了 手工 操作 的 缺点 ,实现 了 作业 的 自动 切换 ,但 在 单 道 批 处 理 系统 
中 ,同一 时 刻 内 存 中 仅 有 一 道 作业 和 运行。 这 就 有 可 能 出 现 两 种 情况 : 对 于 以 计算 为 主 的 作 
业 ,输入 输出 量 少 ,外 部 设备 空闲 ; 而 对 于 以 输入 输出 为 主 的 作业 ,又 会 造成 主机 空闲 。 这 
样 计算 机 资源 的 利用 效率 仍然 不 高 。 为 了 进一步 提高 资源 的 利用 率 , 在 20 世纪 60 年 代 中 
期 引入 了 多 道 程 序 设 计 技术 ,由 此 形成 了 多 道 批 处 理 系统 。 

多 道 批 处 理 系统 具有 以 下 几 个 特点 : 

(1) 多 道 性 。 计 算 机 内 存 中 同时 存放 几 个 相互 独立 的 程序 。 

(2) 无 序 性 。 多 个 程序 完成 的 先后 顺序 与 它们 进入 内 存 的 顺序 并 不 是 严格 对 应 的 ,后 
进入 内 存 的 程序 有 可 能 比 先进 入 内 存 的 程序 先 完成 。 

(3) 调度 性 。 程 序 从 提交 给 系统 开始 到 完成 需要 两 级 调度 , 即 作 业 调度 和 进程 调度 。 

随 着 多 道 批 处 理 系统 的 出 现 ,操作 系统 更 趋 于 完善 了 ,如 今 多 道 批 处 理 系统 仍 是 操作 系 
统 的 三 大 基本 类 型 ( 见 1. 3. 5 节 ) 之 一 。 这 也 说 明 它 具有 其 他 类 型 的 操作 系统 所 不 具备 的 
优点 : 

(1) 资源 利用 率 高 。 内 存 中 多 个 程序 可 以 共享 资源 。 

(2) 系统 吞吐 量 大 。 系 统 知 吐 量 是 指 系统 在 单位 时 间 内 所 完成 的 总 工作 量 。 
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由 于 在 批 处 理 操 作 系 统 中 CPU 和 其 他 资源 能 够 保持 忙碌 状态 ,只 有 当 作 业 完成 或 出 
错时 才 进 行 切换 ,从 而 减 小 了 系统 开销 。 

但 是 批 处 理 系统 无 交互 能 力 。 在 批 处 理 系统 中 ,用 户 以 脱 机 方式 使 用 计算 机 , 即 用 户 从 
提交 作业 到 作业 完成 的 过 程 中 无 法 进行 干预 ,这 给 修改 和 调试 程序 造成 很 大 障碍 。 

第 二 代 计 算 机 主要 用 于 科学 计算 ,程序 大 多 用 FORTRAN 语言 和 汇编 语言 编写 。 典 型 
的 操作 系统 是 FMS(FORTRAN Monitor System) 和 为 IBM 7094 机 配备 的 IBSYS 操作 


1.3.4 分 时 系统 


多 道 程序 系统 解决 了 资源 利用 率 的 问题 ,但 随 着 计算 机 的 普遍 使 用 ,早期 的 批 处 理 系统 
暴露 出 严重 缺陷 ,例如 一 个 作业 从 提交 到 取 回 运行 结果 往往 要 很 长 时 间 。 让 程序 员 更 不 能 
忍受 的 是 ,一 个 误 用 的 逗号 就 会 导致 编译 失败 ,程序 员 必 须 重新 提交 ,重新 等 待 ,浪费 很 长 的 
时 间 。 同 时 , 越 来 越 多 的 用 户 希 望 在 使 用 计算 机 的 过 程 中 能 够 进行 非常 方便 的 人 机 交互 ,也 
就 是 说 可 以 在 程序 运行 时 直接 对 计算 机 进行 控制 。 除 此 之 外 ,很 多 用 户 还 十 分 怀念 手工 操 
作 阶 段 自己 可 以 独占 计算 机 的 良好 感受 。 用 什么 办 法 能 做 到 既 能 保证 计算 机 效率 ,又 能 方 
便 用 户 使 用 呢 ? 在 20 世纪 60 年 代 中 期 , 随 着 键盘 .显示 器 等 交互 设备 的 问世 以 及 计算 机 的 
小 型 和 微型 化 ,用 户 可 以 直接 与 计算 机 打交道 ,也 使 得 这 种 愿望 成 为 可 能 。 这 时 ,第 一 个 分 
时 系统 CTSS 出 现 了 , 它 是 由 麻 省 理工 学 院 开发 的 。 在 分 时 系统 中 ,一 台 计 算 机 可 以 同时 连 
接 多 个 带 有 显示 器 和 键盘 的 用 户 终端 ,同时 允许 用 户 通 过 自己 的 终端 以 交互 方式 使 用 计算 
机 ,共享 主机 中 的 资源 。 由 于 调试 程序 的 用 户 常 常 只 发 出 简短 的 命令 ,而 很 少 执行 费时 较 长 
的 命令 ,所 以 计算 机 能 够 为 一 些 用 户 提供 快速 的 交互 式 服务 ,同时 在 CPU 空闲 时 还 能 运行 
后 台 的 大 作业 。 比 较 著 名 的 多 用 户 分 时 系统 是 UNIX 系统 。 

分 时 系统 采用 了 分 时 技术 ,就 是 把 处 理 机 的 运行 时 间 分 成 很 短 的 时 间 片 ,按时 间 片 轮流 
把 处 理 机 分 配给 各 个 联机 程序 使 用 。 若 某 个 程序 在 分 配给 它 的 时 间 片 内 不 能 完成 其 任务 ， 
则 该 程序 暂时 中 断 ,把 处 理 机 让 给 另 一 程序 使 用 ,等 待 下 一 轮 再 继续 运行 。 由 于 计算 机 速度 
很 快 ,程序 运行 轮换 得 也 很 快 ,每 个 用 户 都 感觉 自己 独占 了 计算 机 ,同时 又 可 以 通过 终端 向 
系统 发 出 各 种 命令 ,控制 程序 的 运行 。 

分 时 系统 与 批 处 理 系统 相 比 具有 完全 不 同 的 特点 : 

(1) 交互 性 。 用 户 可 以 通过 终端 方便 地 进行 人 机 对 话 ,可 以 请 求 系统 提供 各 种 服务 , 特 
别 是 远程 终端 用 户 , 可 以 直接 在 自己 的 终端 上 提交 ,调试 和 运行 程序 。 

(2) 多 用 户 同 时 性 。 允 许 在 一 台 计 算 机 上 连接 多 台 终 端 ,多 个 用 户 通 过 轮流 占用 分 配 
给 自己 的 时 间 片 来 共享 计算 机 资源 。 

(3) 独立 性 。 每 个 用 户 通 过 自己 的 终端 独立 使 用 计算 机 ,感觉 自己 一 个 人 独占 计算 机 
资源 。 

(4) 及 时 性 。 系 统 能 及 时 响应 用 户 的 请 求 。 及 时 是 指 用 户 的 请 求 在 用 户 能 接受 的 时 间 
范围 内 可 以 得 到 响应 ,这 一 时 间 范 围 通常 为 2 一 3s。 

分 时 和 多 道 程序 设计 引发 了 操作 系统 中 的 许多 问题 。 如 果 存 储 器 中 有 多 个 程序 ,必须 
保护 它们 不 互相 干扰 ,例如 一 个 程序 不 会 修改 另 一 个 程序 的 数据 。 对 多 个 交互 用 户 ,必须 对 
文件 系统 进行 保护 ,只 有 授权 用 户 才 可 以 访问 某 个 特定 的 文件 。 还 必须 处 理 资 源 ( 如 打印 


机 ) 争 用 的 问题 。 这 些 问题 (和 其 他 问题 ) 以 及 可 能 的 解决 方法 在 本 书 的 后 面 会 一 一 阐述 。 
1.3.5 实时 系统 


分 时 系统 的 出 现 满足 了 用 户 方便 实用 的 需求 ,然而 用 户 的 需求 是 不 断 变化 的 。 随 着 计 
算 机 的 应 用 范围 的 扩大 ,计算 机 越 来 越 多 地 被 用 于 生产 过 程 的 控制 和 武器 系统 的 实时 控制 。 
这 两 种 控制 系统 都 要 求 能 实时 采集 现场 数据 ,并 对 所 采集 的 数据 进行 及 时 处 理 , 进 而 自动 控 
制 相应 的 执行 机 构 , 以 保证 正常 执行 。 除 此 之 外 ,人 们 还 经 常 需要 对 外 来 的 实时 信息 进行 控 
制 , 例 如 飞机 订 票 系统 和 银行 业务 系统 。 无 论 是 生产 过 程 、 武 器 系统 的 实时 控制 还 是 外 来 信 
息 的 实时 控制 ,都 要 求 系统 能 够 在 允许 的 时 间 范 围 内 作出 响应 ,并 且 对 系统 的 可 靠 性 要 求 也 
比较 高 ,这 样 就 导致 了 实时 系统 的 出 现 。 

实时 就 是 “立即 ”或 及时”, 具体 的 含义 是 指 系统 能 够 及 时 响应 随机 发 生 的 外 部 事件 ,并 
以 足够 快 的 速度 完成 对 事件 的 处 理 。 实 时 系统 的 应 用 环境 是 需要 对 外 部 事件 及 时 作出 响应 
和 处 理 的 场合 。 实 时 系统 按 使 用 场合 和 作用 可 以 分 为 两 类 : 

(1) 实时 控制 系统 。 把 计算 机 用 于 飞行 器 、 导 弹 等 的 自动 控制 ,这 时 计算 机 要 对 测量 系 
统 测 得 的 数据 及 时 加 工 , 并 及 时 输出 结果 以 便 对 目标 进行 跟踪 或 向 操纵 人 员 显 示 。 

它 的 主要 特点 是 : 与 被 控制 过 程 的 速度 相 比 ,其 反应 速度 足够 快 ,工作 安全 可 靠 ,操作 
简便 容错 机 制 比 较 完善 ,即使 系统 中 软 硬 件 发 生 故 障 ,系统 也 能 安全 运行 。 

(2) 实时 信息 处 理 系 统 。 把 计算 机 用 于 预订 飞机 票 , 查 询 航 班 、 航 线 、 票 价 等 事务 时 ,或 
把 计算 机 用 于 银行 系统 、 情 报 检 索 系统 时 ,都 要 求 计算 机 能 对 终端 发 来 的 服务 请 求 及 时 对 以 
正确 的 响应 。 

实时 系统 的 主要 特点 是 即时 响应 和 高 可 靠 性 。 实 时 系统 的 响应 时 间 一 般 是 秒 级 毫秒 
级 甚至 更 小 。 因 为 在 一 些 关键 系统 (如 飞机 的 自动 驾驶 系统 ) 中 ,信息 处 理 的 延误 往往 会 带 
来 不 堪 设 想 的 后 果 。 而 可 靠 性 在 实时 系统 中 比 在 非 实时 系统 中 更 重要 。 非 实时 系统 中 的 暂 
时 故障 可 以 简单 地 通过 重新 启动 系统 来 解决 ,但 实时 系统 要 能 实时 地 响应 和 控制 事件 ,性 能 
的 损失 或 降低 可 能 带 来 巨大 的 灾难 ,会 造成 资金 损失 ,毁坏 主要 设备 ,甚至 危及 生命 。 因 此 ， 
在 实时 系统 中 ,往往 都 采用 了 多 级 容错 措施 来 保障 系统 的 可 靠 性 及 数据 的 安全 人性。 

另外 ,用 户 控制 在 实时 操作 系统 中 通常 比 在 普通 操作 系统 中 更 为 重要 。 在 典型 的 非 实 
时 操作 系统 中 ,用 户 或 者 对 操作 系统 的 调度 功能 没有 任何 控制 ,或 者 只 能 进行 简单 控制 , 例 
如 把 用 户 分 成 多 个 优先 级 组 。 但 在 实时 系统 中 ,允许 用 户 细 粒 度 地 控制 任务 优先 级 是 必 不 
可 少 的 。 用 户 应 该 能 够 区 分 硬 任务 和 软 任务 ,并且 在 每 一 类 中 确定 相对 优先 级 。 实 时 系统 
还 允许 用 户 指定 一 些 特 性 ,例如 使 用 页 面 调度 还 是 进程 交换 , 哪 一 个 进程 必须 常 驻 主 存 , 使 
用 何 种 磁盘 调度 算法 ,不 同 优先 级 的 进程 各 有 哪些 权限 ,等 等 。 

实时 系统 还 包括 机 器 人 、 空 中 交通 管制 ,下 一 代 系统 还 将 包括 自动 驾驶 汽车 .具有 弹性 
关节 的 机 器 人 控制 器 ,智能 化 生产 中 的 系统 查找 以 及 空间 站 和 海底 勘探 等 。 

通常 把 批 处 理 系统 .实时 系统 和 分 时 系统 称 为 操作 系统 的 3 种 基本 类 型 。 一 些 计 算 机 
系统 兼 有 这 三 者 或 其 中 二 者 的 功能 。 

表 1-1 从 多 路 性 、 独 立 性 、 及 时 性 、 交 互 性 及 可 靠 性 几 个 方面 比较 了 批 处 理 系统 、 实 时 系 
统 和 分 时 系统 的 不 同 之 处 。 
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表 1-1 批 处 理 系统 .实时 系统 和 分 时 系统 的 特征 比较 





























系 统 多 路 性 独立 性 及 时 性 交 互 性 可 靠 性 
批 处 理 系统 ig 不 独立 | 不 够 及 时 不 能 进行 交互 可 靠 
分 时 系统 “| 为 多 个 用 户 服务 好 0 可 提供 各 种 交互 服务 | 可 靠 
实时 系统 “| 对 多 个 对 象 进 行 控制 | 好 规定 时 间 ro 高 度 可 靠 





随 着 多 道 程序 技术 的 推广 及 应 用 ,后 期 的 操作 系统 有 了 多 种 操作 方式 和 类 型 。 多 道 批 
处 理 系 统 和 分 时 系统 的 不 断 改进 以 及 实时 系统 的 出 现 使 操作 系统 日 益 完善 。 在 此 基础 上 出 
现 了 通用 操作 系统 ,也 就 是 说 在 一 种 操作 系统 中 同时 具有 了 批 处 理 、 分 时 处 理 和 实时 处 理 的 
功能 。 至 此 ,现代 操作 系统 的 基本 概念 \ 功 能、 结构 和 组 成 都 已 经 形成 。 

引入 多 道 程序 技术 提高 了 系统 资源 的 利用 率 ,但 同时 要 求 有 专门 的 软 硬 件 来 支持 多 道 
程序 ,支持 内 存 的 分 块 以 及 防止 作业 的 相互 干扰 。 因 此 ,通用 操作 系统 的 设计 是 极其 复杂 
的 ,隐患 极 多 ,难以 排除 ,操作 系统 的 设计 者 不 得 不 以 版 本 更 新 的 方式 来 消除 原版 本 中 的 隐 
患 并 增加 新 的 功能 。 


1.3.6 个 人 操作 系统 


随 着 微 电 子 技术 和 VLSI 技术 的 迅速 发 展 ,大 规模 和 超大 规模 集成 技术 用 于 计算 机 ,将 
运算 器 ,控制 器 和 相应 接口 集成 在 一 块 基 片 上 ,产生 了 微 处 理 器 。 计 算 机 硬件 价格 急速 下 
降 , 按 照 计算 机 硬件 分 代 的 概念 趋 于 模糊 ,计算 机 的 体系 结构 趋 于 灵活 、 小 型 .多样 化 。 小 
型 微型 计算 机 在 运算 速度 、 内 存 容量 、 外 存 容量 和 I/O 接口 等 方面 有 了 很 大 的 发 展 。 许 多 
原来 只 能 在 大 型 计算 机 上 实现 的 技术 逐步 下 移 到 小 型 和 微型 计算 机 上 ,出 现 了 面向 个 人 用 
户 的 计算 机 (Personal Computer,PC) ,并 向 便携 式 计 算 机 发 展 。 计 算 机 直接 与 用 户 交 互 , 系 
统 操作 界面 更 加 友好 、 灵 活 方便 ,功能 更 加 强大 ,可 靠 性 更 高 ,体积 更 小 ,价格 更 低 , 得 到 了 越 
来 越 广泛 的 应 用 。 此 时 的 软件 系统 (包括 操作 系统 ) 要 求 面向 用 户 , 使 用 户 操 作 更 方便 灵活 ， 
无 须 了 解 计算 机 硬件 及 其 内 部 操作 。 自 1984 年 Apple 公司 的 Macintosh 计算 机 系统 引入 
图 形 用 户 界面 (GU1) 以 来 ,视窗 操作 和 视窗 界面 得 以 大 大 发 展 , 从 而 形成 了 操作 系统 的 用 户 
界面 管理 功能 模块 。 这 个 时 期 (1980 一 1994 年 ) 被 认为 是 第 四 代 计 算 机 系统 阶段 ,其 配置 的 
操作 系统 被 称 为 现代 操作 系统 。 

个 人 计算 机 上 的 操作 系统 是 一 种 联机 的 交互 式 的 单 用 户 操作 系统 。 由 于 是 个 人 专用 ， 
因此 在 多 用 户 和 分 时 所 要 求 的 对 处 理 机 调度 .存储 保护 方面 将 会 简单 得 多 。 然 而 ,由 于 个 人 
计算 机 的 普及 ,对 于 提供 更 为 方便 友好 的 用 户 接 口 的 要 求 越 来 越 迫 切 。 随 着 多 媒体 技术 的 
引入 ,要求 计算 机 有 一 个 具有 高 速 数据 处 理 能 力 的 实时 多 任务 操作 系统 。 

目前 ,个 人 计算 机 操作 系统 层出不穷 ,有 MS-DOS、UNIX、 Linux、OS/2、Windows、 
MAC 等 ,其 中 有 代表 性 的 是 MS-DOS、Windows、UNIX 和 Linux。 个 人 操作 系统 使 计算 机 
的 使 用 环境 和 开发 平台 越 来 越 灵活 和 高 效 。 多 媒体 技术 的 出 现 和 多 媒体 数据 与 信息 的 处 理 
给 个 人 计算 机 操作 系统 提出 了 更 高 的 要 求 。 个 人 计算 机 操作 系统 要 满足 应 用 领域 的 各 种 要 





求 , 要 处 理 信息 社会 中 的 多 种 媒体 信息 ,要 提供 更 灵活 友好 的 用 户 界 面 , 它 必 须 提供 新 的 功 
能 ,支持 各 种 不 同类 型 的 外 部 设备 ,这样 的 操作 系统 才 会 受到 用 户 的 欢迎 , 才 会 有 强大 的 生 
命 力 。 


1.3.7 网 络 操作 系统 


由 于 网 络 的 出 现 和 发 展 ,现代 操作 系统 的 主要 特征 之 一 就 是 具有 上 网 功能 。 网 络 操作 
系统 是 建立 在 计算 机 网 络 的 基础 上 的 ,通过 通信 设施 将 物理 上 分 散 的 多 个 计算 机 系统 互 连 
起 来 ,实现 信息 交换 ,资源 共享 ` 可 互 操作 和 协作 。 它 具有 这 样 的 特征 : 

(1) 计算 机 网 络 是 一 个 互 连 的 计算 机 系统 的 群体 。 这 些 计算 机 系统 在 物理 上 是 分 散 
的 ,可 能 在 一 个 房间 里 ,在 一 个 单位 里 ,在 一 个 城市 或 几 个 城市 里 ,甚至 在 全 国 或 全 球 范 
围 内 。 

(2) 这 些 计 算 机 是 自治 的 ,每 台 计 算 机 有 自己 的 操作 系统 ,各 自 独立 工作 ,它们 在 网 络 
协议 控制 下 协同 工作 。 

(3) 系统 互 连 要 通过 通信 设施 (硬件 .软件 ) 来 实现 。 

(4) 系统 通过 通信 设施 执行 信息 交换 ,资源 共享 、 互 操作 和 协作 处 理 , 实 现 多 种 应 用 要 
求 。 互 操作 和 协作 处 理 是 计算 机 网 络 应 用 中 更 高 层次 的 特征 。 它 需要 有 一 个 环境 支持 网 络 
环境 下 互 连 的 异种 计算 机 系统 之 间 的 进程 通信 ,实现 协同 工作 和 应 用 集成 。 

网 络 操 作 系 统 与 单 处 理 机 的 操作 系统 没有 本 质 的 区 别 。 它 们 需要 一 个 网 络 接口 控制 器 
以 及 一 些 低层 软件 来 驱动 它 , 同 时 还 需要 一 些 程序 来 进行 远程 登录 和 远程 文件 访问 ,但 这 些 
附加 功能 并 未 改变 操作 系统 的 本 质 结构 。 网 络 操作 系统 的 研制 开发 是 在 原来 各 计算 机 操作 
系统 的 基础 上 进行 的 ,按照 网 络 体 系 结构 的 各 个 协议 标准 进行 开发 ,包括 网 络 管理 、 通 信 , 资 
源 共 享 、 系 统 安 全 和 多 种 网 络 应 用 服务 等 。 


1.3.8 分 布 式 操作 系统 


粗 看 起 来 ,分 布 式 系统 与 网 络 没有 多 大 区 别 。 分 布 式 系统 也 可 以 定义 为 通过 通信 网 络 
将 物理 上 分 布 的 具有 自治 功能 的 数据 处 理 系 统 或 计算 机 系统 互 连 起 来 ,实现 信息 交换 和 资 
源 共享 ,协作 完成 任务 。 但 是 两 者 有 这 样 一 些 明 显 的 区 别 : 

(1) 对 于 计算 机 网 络 ,现在 已 制定 了 明确 的 通信 网 络 协议 体系 结构 及 一 系列 协议 族 , 即 
ISO/OSI 开放 式 系统 互 连 体系 结构 及 一 系列 标准 协议 (或 IEEE .CCITT 相应 的 标准 等 ) , 计 
算 机 网 络 的 开发 都 遵循 协议 ,而 对 于 各 种 分 布 式 系统 并 没有 制定 标准 的 协议 。 当 然 ,计算 机 
网 络 也 可 认为 是 一 种 分 布 式 系统 。 

(2) 分 布 式 系统 要 求 一 个 统一 的 操作 系统 ,实现 系统 操作 的 统一 性 。 为 了 把 数据 处 理 
系统 的 多 个 通用 部 件 合并 成 为 一 个 具有 整体 功能 的 系统 ,必须 引入 一 个 高 级 操作 系统 。 各 
处 理 机 有 自己 的 私有 操作 系统 ,必须 有 一 个 策略 使 整个 系统 融 为 一 体 ,这 是 高 级 操作 系统 的 
任务 。 它 可 以 以 两 种 形式 出 现 : 一 种 是 在 各 处 理 机 的 私有 操作 系统 之 外 独立 存在 ,私有 操 
作 系 统 可 以 识别 和 调用 它 ; 另 一 种 是 在 各 处 理 机 私有 操作 系统 的 基础 上 加 以 扩展 。 对 于 各 
个 物理 资源 的 管理 ,高 级 操作 系统 和 各 私有 操作 系统 之 间 不 允许 有 明显 的 主 从 管理 关系 。 
在 计算 机 网 络 中 ,实现 全 网 的 统一 管理 的 网 络 管理 系统 已 成 为 越 来 越 重 要 的 组 成 部 分 。 
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(3) 系统 的 透明 性 。 分 布 式 操作 系统 负责 全 系统 的 资源 分 配 和 调度 ,任务 划分 ,信息 传 
输 控制 协调 工作 ,并 为 用 户 提供 一 个 统一 的 界面 ,用 户 通过 这 一 界面 实现 所 需 的 操作 和 使 用 
系统 资源 ,至 于 操作 定 在 哪 一 台 计算 机 上 执行 或 使 用 哪 台 计 算 机 的 资源 则 是 系统 的 事 , 用 户 
是 不 用 知道 的 ,也 就 是 系统 对 用 户 是 透明 的 。 但 是 对 于 计算 机 网 络 , 若 一 台 计算 机 上 的 用 户 
希望 使 用 另 一 台 计 算 机 上 的 资源 , 则 必须 明确 指明 是 哪 台 计算 机 。 

(4) 分 布 式 系统 的 基础 是 网 络 。 它 和 常规 网 络 一 样 具 有 模块 性 、 并 行 性 、 自 治 性 和 通用 
性 等 特点 ,但 它 比 常规 网 络 又 有 进一步 的 发 展 。 因 为 分 布 式 系统 已 不 仅 是 一 个 物理 上 的 松 
散 耦 合 系统 ,同时 还 是 一 个 逻辑 上 紧密 耦合 的 系统 。 分 布 式 系统 由 于 更 强调 分 布 式 计 算 和 
处 理 , 因 此 对 于 多 机 合作 、 系 统 重 构 、 健 壮 性 和 容错 能 力 有 更 高 的 要 求 ,希望 系统 有 更 短 的 响 
应 时 间 \ 高 吞吐 量 和 高 可 靠 性 。 

20 世纪 90 年 代 出 现 的 网 络 计算 (network computing) 和 高 速 网 络 已 使 分 布 式 系 统 变 得 
越 来 越 现实 。 特 别 是 Sun 公司 的 Java 语言 和 运行 在 各 种 通用 操作 系统 之 上 的 Java 虚拟 机 
和 Java OS 的 出 现 , 更 进一步 加 快 了 这 一 趋势 。 另 外 ,软件 构件 技术 的 发 展 也 将 加 快 分 布 式 


1.3.9 嵌入 式 操作 系统 


随 着 人 们 对 新 技术 和 物质 生活 的 更 高 追求 ,操作 系统 的 使 用 已 不 仅仅 限于 计算 机 领域 。 
近 几 年 ,嵌入 式 系统 已 经 成 为 操作 系统 的 最 新 发 展 趋 势 之 一 。 髋 入 式 系统 可 以 广泛 地 用 于 
PDA ,移动 电话 、 家 用 电器 等 电子 产品 中 。 它 们 固化 在 汽车 、 电 梯 、 电 视 、 录 像 机 、 游 戏 机 、CD 
机 等 人 们 身边 大 量 的 设备 设施 上 。 除 此 之 外 ,嵌入 式 操 作 系 统 在 工业 机 器 人 、 医 药 设备 、 电 
话 、 卫 星 、 飞 行 等 领域 同样 扮演 了 重要 的 角色 。 一 般 来 说 , 典 入 式 系 统 是 指 那些 执行 专用 功 
能 并 被 内 部 计算 机 控制 的 设备 或 者 系统 。 和 嵌入 式 系统 不 能 使 用 通用 型 计算 机 ,而 且 运 行 的 
是 固化 的 软件 ,用 术语 表示 就 是 固件 (firmware) ,终端 用 户 很 难 或 者 不 可 能 改变 固件 。 也 就 
是 说 , 镰 嵌 在 普通 PC 以 外 的 所 有 电子 设备 中 的 操作 系统 都 是 嵌入 式 操作 系统 。 典 人 式 系 
统 包括 硬件 和 软件 两 部 分 。 硬 件 包 括 处 理 器 / 微 处 理 器 .存储 器 .外 设 器 件 .IO 端口 和 图 形 
控制 器 等 。 软 件 部 分 包括 操作 系统 (要 求实 时 和 多 任务 操作 ) 和 应 用 程序 。 有 时 设计 人 员 把 
这 两 种 软件 组 合 在 一 起 。 应 用 程序 控制 着 系统 的 运作 和 行为 ,而 操作 系统 控制 着 应 用 程序 
与 硬件 的 交互 。 

嵌入 式 系统 的 核心 是 嵌入 式微 处 理 器 。 骨 入 式微 处 理 器 一 般 具 备 以 下 4 个 特点 : 

(1) 对 实时 多 任务 有 很 强 的 支持 能 力 ,能 完成 多 任务 并 且 有 较 短 的 中 断 响应 时 间 , 从 而 
使 内 部 的 代码 和 实时 内 核 的 执行 时 间 减 少 到 最 低 限度 。 

(2) 具有 功能 很 强 的 存储 区 保护 功能 。 这 是 由 于 嵌入 式 系 统 的 软件 结构 已 模块 化 ,而 
为 了 避免 在 软件 模块 之 间 出 现 错 误 的 交叉 作用 ,需要 设计 强大 的 存储 区 保护 功能 ,同时 也 有 
利于 软件 诊断 。 

(3) 可 扩展 的 处 理 器 结构 ,能 迅速 地 扩展 出 满足 应 用 需求 的 最 高 性 能 的 嵌入 式微 处 
理 咒 。 

(4) 嵌入 式微 处 理 器 必须 功 耗 很 低 ,尤其 是 用 于 便携 式 的 无 线 及 移动 的 计算 和 通信 设 
备 中 , 靠 电池 供电 的 嵌入 式 系统 更 是 如 此 ,如 需要 功 耗 只 有 毫 瓦 甚至 微 瓦 级 。 

嵌入 式 计算 机 系统 同 通用 型 计算 机 系统 相 比 具有 以 下 特点 : 


(1) 嵌入 式 系统 通常 是 面向 特定 应 用 的 。 藤 入 式 CPU 与 通用 型 CPU 的 最 大 不 同 就 是 
嵌入 式 CPU 大 多 工作 在 为 特定 用 户 群 设计 的 系统 中 , 它 通 常 都 具有 低 功 耗 ,体积 小 、 集 成 
度 高 等 特点 ,能 够 把 通用 CPU 中 许多 由 板 卡 完成 的 任务 集成 在 芯片 内 部 ,从 而 有 利于 嵌入 
式 系统 小 型 化 ,移动 能 力 大 大 增强 ,与 网 络 的 耦合 也 越 来 越 紧 密 。 

(2) 嵌入 式 系统 是 将 先进 的 计算 机 技术 、 半 导体 技术 和 电子 技术 与 各 个 行业 的 具体 应 
用 相 结合 的 产物 。 这 决定 了 它 必 然 是 一 个 技术 密集 资金 密集 、 高 度 分 散 、 不 断 创新 的 知识 

(3) 嵌入 式 系统 的 硬件 和 软件 都 必须 高 效率 地 设计 ,量体裁衣 ,去 除 宛 余 , 力 争 在 同样 
的 芯片 面积 上 实现 更 高 的 性 能 ,这 样 才能 在 具体 应 用 中 更 具有 竞争 力 。 

(4) 嵌入 式 系统 和 具体 应 用 有 机 地 结合 在 一 起 , 它 的 升级 换代 也 是 和 具体 产品 同步 进 
行 的 ,因此 嵌入 式 系统 产品 一 旦 进入 市 场 , 就 具有 较 长 的 生命 周期 。 

(5) 为 了 提高 执行 速度 和 系统 可 靠 性 ,嵌入 式 系统 中 的 软件 一 般 都 固化 在 存储 器 芯片 
或 单片机 中 ,而 不 是 存储 于 磁盘 等 载体 中 。 


1.3.10 操作 系统 的 发 展 趋势 


随 着 计算 机 技术 的 飞速 发 展 , 新 型 计算 机 层出不穷 ,按照 硬件 划分 时 代 的 概念 已 经 模 
糊 , 分 代 已 无 多 大 意义 。 计 算 机 科学 在 快速 地 发 展 , 随 着 人 们 对 计算 机 的 应 用 和 认识 ,对 于 
计算 机 的 使 用 需求 更 加 广泛 而 复杂 ,操作 系统 下 一 步 的 发 展 给 入 们 带 来 了 无 限 的 遐想 空间 。 
当前 ,操作 系统 主要 的 发 展 类 型 将 趋向 巨型 化 ,微型 化 网络 化 和 智能 化 。 


(1.4 操作 系统 的 功能 和 特性 


从 操作 系统 的 定义 可 知 , 操 作 系 统 是 直接 控制 和 管理 计算 机 软 硬 件 资源 的 最 基本 的 系 
统 软件 ,那么 操作 系统 具有 哪些 功能 以 及 与 其 他 软件 不 同 的 特点 呢 ? 


1.4.1 操作 系统 的 功能 


操作 系统 是 计算 机 系统 资源 的 管理 者 ,如 何 最 大 限度 地 提高 计算 机 系统 资源 的 使 用 效 
率 ,如 何 为 用 户 提供 一 个 方便 的 使 用 环境 是 操作 系统 要 解决 的 两 大 主要 问题 ,也 是 使 用 计算 
机 的 目标 。 一 般 将 计算 机 资源 分 为 硬件 资源 和 软件 资源 。 前 者 主要 包括 处 理 机 、 存 储 器 (内 
存 和 外 存 )、 输 入 输出 设备 。 而 后 者 主要 包括 各 种 程序 和 数据 ,它们 都 以 文件 形式 存储 在 外 
存储 器 中 。 因 此 ,常规 的 操作 系统 通常 具有 如 下 5 个 方面 的 功能 。 


1. 进程 管理 


进程 管理 主要 是 对 处 理 机 的 管理 。 为 了 提高 CPU 的 利用 率 , 采 用 多 道 程序 技术 ; 为 了 
描述 多 道 程序 的 并 发 执行 ,引入 进程 的 概念 ,通过 进程 管理 协调 多 道 程序 之 间 的 关系 ,以 使 
多 道 程序 可 以 以 最 高 的 效率 执行 ,并 且 使 CPU 资源 得 到 最 充分 的 利用 。 进 程 管理 主要 的 
功能 如 下 : 

(1) 进程 控制 。 在 多 道 程序 环境 下 ,必须 为 每 个 程序 建立 一 个 或 几 个 对 应 的 进程 。 进 
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程控 制 主要 包括 进程 的 创建 .进程 的 撤销 、 进 程 的 阻塞 与 唤醒 。 

(2) 进程 的 同步 控制 。 引 入 多 道 程序 后 ,由 于 进程 之 间 的 相互 限制 和 相互 依赖 ,导致 进 
程 之 间 出 现 了 两 种 关系 : 互 太 与 同步 。 进 程 管理 必须 提供 相应 的 同步 机 制 ,协调 进程 之 间 
的 运行 ,以 保证 进程 执行 结果 的 正确 性 。 

(3) 进程 通信 。 多 个 进程 之 间 具 有 相互 合作 的 关系 ,由 此 它们 之 间 必 须 交 换 一 定 的 信 
息 。 进 程 通信 的 任务 就 是 实现 相互 合作 的 进程 之 间 的 信息 交换 。 

(4) 调度 。 系 统 中 同时 存在 多 个 进程 ,它们 都 要 求 得 到 CPU 的 处 理 , 进 程 调度 的 主要 
任务 就 是 按照 一 定 的 算法 从 多 个 就 绪 队 列 中 选中 一 个 进程 ,使 之 得 到 执行 。 


2. 存储 管理 


内 存 的 需求 量 大 ,而 内 存 价格 又 昂贵 , 且 受 CPU 寻 址 能 力 的 限制 ,内 存 容量 有 限 。 
此 , 当 多 个 程序 共享 内 存 时 ,如 何 为 它们 分 配 内 存 空 间 , 使 它们 彼此 隔离 互 不 侵扰 ,并 且 可 
以 在 一 定 条 件 下 互相 调用 , 当 内 存 不 够 用 时 ,如 何 把 当前 运行 的 数据 及 程序 即时 调 出 内 存 ， 
需要 运行 时 再 从 外 存 调 入 内 存 , 等 等 ,都 是 存储 管理 的 任务 。 


3. 设备 管理 


设备 管理 指 对 除 CPU 和 内 存 外 的 所 有 1/O 设备 的 管理 。 除 了 进行 实际 I/O 操作 的 设 
备 外 ,还 包括 诸如 设备 控制 器 .DMA(Direct Memory Access, 直 接 存储 访问 ) 控 制 器 .通道 
等 支持 设备 。 设 备 管理 的 首要 任务 是 为 这 些 设备 提供 驱动 程序 或 控制 程序 ,以 使 用 户 不 必 
详细 了 解 设备 及 接口 的 技术 细节 ,就 可 方便 地 对 这 些 设备 进行 操作 。 其 另 一 个 任务 就 是 利 
用 中 断 技术 .DMA 技术 和 通道 技术 ,使 外 部 设备 尽 可 能 与 CPU 并 行 工作 ,以 提高 设备 的 使 
用 效率 ,并 提高 整个 系统 的 运行 速度 。 


4. 文件 管理 


文件 管理 主要 指 对 程序 和 数据 等 软件 资源 进行 的 管理 。 程 序 和 数据 是 以 文件 的 形式 存 
放 在 外 部 存储 器 中 的 , 当 需 要 时 再 把 它们 装 和 内存 ( 操 作 系统 本 身 也 是 文件 )。 文 件 是 软件 
资源 ,有 效 地 组 织 、 存 储 、 保 护 文件 ,以 使 用 户 方便 、 安 全 地 访问 它们 ,以 及 对 文件 系统 进行 优 
化 ,这 些 都 是 文件 管理 的 任务 。 


5. 用 户 接口 


除 对 系统 资源 的 管理 外 ,操作 系统 还 必须 向 用 户 提供 直接 使 用 操作 系统 的 手段 。 目 前 
的 操作 系统 都 提供 3 种 接口 。 第 一 种 是 命令 接口 ,用户 可 通过 该 接口 向 系统 发 出 命令 以 控 
制程 序 运行 。 这 种 接口 又 进一步 分 为 联机 用 户 接口 和 脱 机 用 户 接口 ,前 者 由 一 组 键盘 操作 
命令 以 及 命令 解释 程序 组 成 ,后 者 由 一 组 控制 命令 组 成 。 第 二 种 是 程序 接口 , 即 提供 一 组 广 
义 指令 (系统 调用 ) 供 用 户 程 序 和 其 他 系统 程序 调用 。 每 当 应 用 程序 要 求 操作 系统 提供 某 种 
服务 (功能 ) 时 , 便 启动 具有 相应 功能 的 系统 调用 。 第 三 种 是 图 形 接口 ,这 是 较 晚 出 现 的 操作 
系统 提供 的 , 它 采 用 了 图 形 化 的 操作 界面 ,用 非常 容易 识别 的 各 种 图 标 将 系统 的 各 项 功能 、 
各 种 应 用 程序 和 文件 直观 地 标示 出 来 ,用 户 可 用 鼠标 方便 地 完成 操作 ,而 不 用 花费 大 量 时 间 
记忆 各 种 命令 的 名 字 与 格式 ,使 得 计算 机 操作 变 得 更 为 方便 。 目 前 主流 的 操作 系统 都 提供 


了 图 形 接口 。 


1.4.2 操作 系统 的 基本 特征 


尽管 每 种 类 型 的 操作 系统 各 有 其 特征 ,但 作为 现代 操作 系统 ,都 具有 3 个 基本 特征 : 并 
发 性 .共享 性 和 不 确定 性 。 这 三 个 特征 是 互相 联系 和 互相 依赖 的 ,是 互相 独立 的 用 户 使 用 有 
限 的 计算 机 资源 的 方式 的 反映 。 


1. 并 发 性 


并 发 性 是 指 程序 的 并 发 执行 ,也 就 是 在 内 存 中 同时 存放 多 个 程序 ,它们 同时 处 于 运行 状 
态 。 并 发 性 是 操作 系统 的 主要 特征 之 一 。 并 发 性 不 仅 体现 在 操作 系统 与 用 户 程序 一 起 并 发 
运行 ,就 连 操作 系统 本 身 的 各 种 程序 之 间 也 是 并 发 运行 的 ,它们 为 用 户 提供 并 发 服务 。 

应 当 指 出 ,通常 的 程序 是 静态 实体 ,它们 是 不 能 并 发 执行 的 。 为 了 使 多 个 程序 能 够 并 发 
执行 ,在 操作 系统 中 引入 了 进程 的 概念 ,以 描述 程序 的 执行 过 程 和 共享 资源 的 基本 单位 。 关 
于 进程 在 后 面 会 作 详细 阑 述 。 

还 有 一 点 需要 注意 的 是 ,并 行 性 和 并 发 性 是 两 个 既 相 似 又 有 区 别 的 概念 。 并 行 性 指 两 
个 或 多 个 事件 在 同一 时 刻 发 生 ,是 针对 多 处 理 机 的 计算 机 系统 来 说 的 。 而 并 发 性 指 两 个 或 
多 个 事件 在 同一 时 间 间 隔 内 发 生 ,也 就 是 在 单 处 理 机 的 情况 下 ,宏观 上 有 多 个 程序 在 同时 运 
行 , 但 微观 上 每 一 时 刻 仅 能 有 一 个 程序 执行 ,也 就 是 说 这 些 程序 只 能 分 时 交替 执行 。 

操作 系统 中 程序 的 并 发 执行 使 系统 变 得 更 为 复杂 ,以 致使 系统 中 必须 增设 若干 新 的 功 
能 模块 ,分 别 用 于 处 理 器 、 内 存 、 外 设 以 及 文件 系统 等 资源 的 管理 。 


2. 共享 性 


并 发 运行 的 程序 可 共享 系统 资源 。 这 种 共享 分 为 两 种 方式 : 互 斥 共 享 方 式 和 同时 访问 
方式 ,对 于 系统 中 的 一 些 资源 ,如 打印 机 ,在 一 段 时 间 里 只 允许 一 个 进程 使 用 ,进程 对 此 资源 
的 共享 是 互 斥 的 ,只 有 一 个 进程 使 用 完 之 后 , 另 一 个 进程 才能 够 使 用 。 而 对 于 另外 一 些 资 
源 , 如 磁盘 设备 ,可 以 被 多 个 进程 同时 访问 。 

并 发 和 共享 互 为 存在 的 条 件 , 只 有 程序 并 发 执行 ,才能 谈 得 上 资源 共享 ; 反 过 来 ,如 果 
不 能 对 资源 共享 进行 有 效 的 管理 协调 ,程序 并 发 执行 的 效率 也 会 降低 ,甚至 无 法 执行 。 


3. 不 确定 性 


不 确定 性 也 称 为 操作 系统 的 随机 性 ,是 指 操作 系统 面 对 的 是 各 类 随机 事件 。 在 多 道 程 
序 环境 下 ,允许 多 个 程序 并 发 执行 。 内 存 中 每 个 进程 在 何 时 获得 处 理 机 运行 , 何 时 以 因 某 种 
原因 (如 打印 机 请 求 ) 而 暂停 ,以 及 进程 以 怎样 的 速度 向 前 推进 ,每 道 程序 总 共 需 要 多 少时 间 
完成 ,等 等 ,都 是 不 可 预知 的 。 

操作 系统 的 不 确定 性 是 并 发 与 共享 的 必然 结果 。 人 们 不 能 对 于 运行 的 程序 的 状态 以 
及 硬件 设备 的 情况 做 任何 假定 ,因而 一 般 来 说 无 法 确切 地 知道 系统 正 处 于 什么 状态 。 为 
了 随机 响应 和 正确 无 误 地 处 理 各 种 随机 事件 ,操作 系统 必须 事先 安排 好 对 各 种 可 能 事件 
的 处 理 。 
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(5 操作 系统 结构 


操作 系统 是 一 个 庞大 的 软件 工程 项 目 , 需 要 采用 工程 化 的 方法 进行 开发 ,而 一 个 庞大 的 
软件 开发 首要 的 任务 就 是 体系 结构 的 设计 。 而 随 着 操作 系统 应 用 领域 的 扩大 以 及 操作 系统 
硬件 平台 的 多 样 化 ,操作 系统 的 体系 结构 也 在 不 断 更 新 。 从 内 核 功 能 和 结构 特点 区 分 ,目前 
通用 机 上 常见 操作 系统 的 体系 结构 主要 有 如 下 几 种 : 模块 组 合 结构 、 层 次 结构 、 微 内 核 结构 
和 虚拟 机 结构 。 


1.5.1 模块 组 合 结构 及 层次 结构 


在 传统 的 软件 开发 中 ,整个 软件 以 过 程 集合 的 方式 实现 ,系统 中 的 每 一 个 过 程 模块 根据 
它们 要 完成 的 功能 划分 ,然后 按照 一 定 的 结构 方式 组 合 起 来 ,协同 完成 整个 系统 的 功能 。 

操作 系统 最 初 是 以 建立 一 个 简单 的 小 系统 为 目标 的 ,后 来 为 了 满足 其 他 需求 又 陆续 加 
入 一 些 新 的 功能 ,因此 ,操作 系统 功能 由 一 系列 模块 组 合 而 成 ,如 图 1-9 所 示 , 任 何 模块 之 间 
都 可 进行 任意 调用 ,因此 这 种 操作 系统 称 为 模块 组 合 结构 。 模 块 组 合 结构 的 操作 系统 不 进 
行 任何 数据 封装 和 隐藏 ,在 具有 较 高 效率 的 同时 ,存在 着 难以 扩展 和 升级 的 缺点 。CP/M 和 
MS-DOS 属于 此 类 结构 的 操作 系统 。 

为 了 弥补 模块 组 合 结构 中 模块 间 调用 存在 的 固有 不 足 之 处 ,就 必须 减少 模块 毫 无 规则 
的 相互 调用 、 相 互 依赖 的 关系 ,尤其 要 清除 模块 间 的 循环 调用 。 从 这 一 点 出 发 ,层次 结构 的 
设计 采用 了 高 层 建筑 结构 的 理念 ,如 图 1-10 所 示 , 层 次 结构 的 操作 系统 将 模块 功能 划分 为 
不 同 层次 ,下 层 模块 封装 内 部 细节 ,上 层 模 块 通过 接口 调用 下 层 模块 。UNIX、Linux、VAX/ 
VMS、MULTICS 等 属于 层次 结构 操作 系统 。 层 次 化 使 操作 系统 结构 简单 ,易于 调试 和 扩 
展 。 在 层次 结构 中 层 与 层 之 间 的 调用 关系 严格 遵守 调用 规则 ,每 一 层 只 能 够 访问 其 下 层 所 
提供 的 服务 ,利用 这 些 服务 来 实现 本 层 的 功能 并 为 其 上 层 提供 服务 。 操 作 系 统 每 执行 一 个 
功能 ,通常 要 自 上 而 下 穿越 很 多 层 , 这 会 降低 系统 的 执行 效率 。 
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图 1-9 模块 组 合 结构 1-10 分 层 结构 


不 论 是 模块 组 合 结构 还 是 层次 结构 ,操作 系统 都 包括 了 将 其 用 于 各 种 可 能 领域 时 需要 
的 功能 , 故 被 称 为 宏 内 核 操 作 系 统 ,可 以 认为 该 内 核 本 身 便 是 一 个 完整 的 操作 系统 。 以 
UNIX 为 例 ,其 内 核 包 括 了 进程 管理 .文件 系统 、 设 备 管理 ,网 络 通信 等 功能 ,用 户 层 仅 提供 
一 个 操作 系统 外 壳 和 一 些 实用 工具 程序 。 


1.5.2 微 内 核 结构 


传统 上 ,所 有 的 操作 系统 代码 都 在 内 核 中 ,这 会 导致 内 核 中 发 现 一 个 错误 就 会 拖累 整个 
系统 。 例 如 ,由 于 所 有 的 设备 驱动 程序 都 在 内 核 中 ,一 个 有 故障 的 音频 驱动 程序 就 会 造成 整 
个 系统 停机 。 相 反 , 如 果 把 整个 设备 驱动 程序 和 文件 系统 分 别 作 为 普通 用 户 进程 ,这 些 模块 
中 的 错误 虽然 会 使 模块 本 身 崩 溃 , 但 是 不 会 使 得 整个 系统 死机 。 为 了 实现 系统 的 可 靠 性 ,将 
操作 系统 中 能 实现 最 基本 核心 功能 的 部 分 放 入 内 核 中 ,只 有 这 个 微小 的 内 核 运 行 在 内 核 态 
上 。 由 于 操作 系统 核心 常 驻 内 存 , 而 微 内 核 结构 精 简 了 操作 系统 的 核心 功能 ,内 核 规模 比较 
小 ,一 些 功 能 都 移 到 了 外 存 上 ,所 以 微 内 核 结构 十 分 适合 资源 相对 有 限 的 说 入 式 专 用 系统 。 
微 内 核 操 作 系 统 (microkernel operating system) 结 构 是 多 线程 的 ,能 支持 多 处 理 机 运行 的 
系统 , 故 非常 适用 于 分 布 式 系统 环境 。 当 前 比较 流行 的 操作 系统 几乎 全 部 都 采用 了 微 内 核 
结构 ,如 MACH、MacOS、Windows 等 。 


1. 微 内 核 操 作 系 统 


如 图 1-11 所 示 , 微 内 核 操 作 系 统 将 很 多 通用 操作 的 功能 从 内 核 中 分 离 出 来 (如 文件 系 
统 、 设 备 驱 动 、 网 络 协 议 栈 等 ), 只 将 最 基本 的 内 容 放 入 微 内 核 中 , 绝 大 部 分 功能 放 在 微 内 核 
外 的 各 种 服务 器 中 实现 。 微 内 核 结构 由 一 个 非常 简单 的 硬件 抽象 层 和 一 组 比较 关键 的 原 语 
或 系统 调用 组 成 。 这 些 原 语 仅 仅 包括 了 建立 一 个 系统 必需 的 几 个 部 分 ,如 线程 管理 、 地 址 空 
间 和 进程 间 通 信 等。 
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图 1-11 微 内 核 结构 


1) 进程 (线程 ) 管 理 
大 多 数 的 微 内 核 操作 系统 对 于 进程 管理 功能 的 实现 都 采用 “机 制 与 策略 分 离 ”* 的 原则 。 
例如 ,为 实现 进程 (线程 ) 调 度 功 能 ,必须 在 进程 管理 中 设置 一 个 或 多 个 进程 (线程 ) 优 先 级 队 
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列 ,能 将 指定 优先 级 的 进程 (线程 ) 从 所 在 队列 中 取出 ,并 将 其 投入 执行 。 由 于 这 一 部 分 属于 
调度 功能 的 机 制 部 分 ,应 将 它 放 入 微 内 核 中 。 如 何 确定 每 类 用 户 ( 进 程 ) 的 优先 级 ,以 及 如 何 
修改 它们 的 优先 级 等 ,都 属于 策略 问题 ,可 将 它们 放 入 微 内 核 外 的 进程 (线程 ) 管 理 服务 
器 中 。 

2) 低级 存储 器 管理 

通常 在 微 内 核 中 只 配置 最 基本 的 低级 存储 器 管理 机 制 。 例 如 用 于 实现 将 用 户 空间 的 四 
辑 地 址 变换 为 内 存 空 间 的 物理 地 址 的 页 表 机 制 和 地 址 变换 机 制 , 这 一 部 分 是 依赖 于 机 器 的 ， 
因此 放 入 微 内 核 。 而 实现 虚拟 存储 器 管理 的 策略 包含 应 采取 何 种 页 面 置 换算 法 ,采用 何 种 
内 存 分 配 与 回收 策略 等 , 则 放 在 微 内 核 外 的 存储 器 管理 服务 器 中 实现 。 

3) 中 断 和 陷入 处 理 

大 多 数 微 内 核 操 作 系 统 都 是 将 与 硬件 紧密 相关 的 一 小 部 分 功能 放 入 微 内 核 中 。 此 时 微 
内 核 的 主要 功能 是 捕获 中 断 和 陷入 事件 ,并 进行 相应 的 前 期 处 理 。 例 如 进行 中 断 现场 保护 ， 
识别 中 断 和 陷入 的 类 型 ,然后 将 有 关 事 件 的 信息 转换 成 消息 后 发 送 给 相关 的 服务 器 ,由 服务 
器 根据 中 断 或 陷入 的 类 型 ,调用 相应 的 处 理 程序 来 进行 后 期 处 理 。 


2. 微 内 核 操 作 系 统 的 优点 


1) 提高 了 可 扩展 性 

由 于 微 内 核 操作 系统 的 许多 功能 是 由 相对 独立 的 服务 器 软件 来 实现 的 , 当 开 发 了 新 的 
硬件 和 软件 时 , 微 内 核 操 作 系 统 只 须 在 相应 的 服务 器 中 增加 新 的 功能 ,或 增加 一 个 专门 的 服 
务 器 。 与 此 同时 ,还 可 以 改善 系统 的 灵活 性 ,不 仅 可 在 操作 系统 中 增加 新 的 功能 ,还 可 修改 
原 有 功能 ,删除 已 过 时 的 功能 ,以 形成 一 个 更 为 精练 高 效 的 操作 系统 。 

2) 增强 了 可 靠 性 

这 一 方面 是 由 于 微 内 核 是 作 了 精心 设计 和 严格 测试 的 ,容易 保证 其 正确 性 ; 另 一 方面 
是 由 于 它 提供 了 规范 而 精简 的 应 用 程序 接口 (APD ,为 编制 微 内 核 外 部 的 高 质量 的 代码 创 
造 了 条 件 。 此 外 ,由 于 所 有 服务 器 都 运行 在 用 户 态 ,服务 器 与 服务 器 之 间 采 用 的 是 消息 传递 
通信 机 制 ,因此 , 当 某 个 服务 器 出 现 错误 时 ,不 会 影响 内 核 ,也 不 会 影响 其 他 服务 器 。 

3) 增强 了 可 移植 性 

随 着 硬件 的 快速 发 展 ,出 现 了 各 种 各 样 的 硬件 平台 。 作 为 一 个 好 的 操作 系统 ,必须 具备 
可 移植 性 ,使 其 能 较 容易 地 运行 在 不 同 的 计算 机 硬件 平台 上 。 在 微 内 核 结构 的 操作 系统 中 ， 
所 有 与 特定 CPU 和 LIVO 设备 硬件 有 关 的 代码 均 放 在 内 核 和 内 核 下 面 的 硬件 隐藏 层 中 ,而 
操作 系统 绝 大 部 分 功能 ( 即 各 种 服务 器 ) 均 与 硬件 平台 无 关 , 因 而 ,把 操作 系统 移植 到 另 一 个 
计算 机 硬件 平台 上 所 需 的 修改 是 比较 小 的 。 

4) 提供 了 对 分 布 式 系统 的 支持 

由 于 在 微 内 核 操作 系统 中 ,客户 和 服务 器 之 间 以 及 服务 器 和 服务 器 之 间 的 通信 是 采用 
消息 传递 通信 机 制 进行 的 ,使 微 内 核 操作 系统 能 很 好 地 支持 分 布 式 系统 和 网 络 系统 。 事 实 
上 ,只 要 在 分 布 式 系统 中 赋予 所 有 进程 和 服务 器 唯一 的 标识 符 ,在 微 内 核 中 再 配置 一 张 系统 
映射 表 ( 即 进程 和 服务 器 的 标识 符 与 它们 所 驻 留 的 计算 机 之 间 的 对 应 表 ) ,在 进行 客户 与 服 
务 器 通信 时 ,只 需 在 发 送 的 消息 中 加 上 发 送 进程 和 接收 进程 的 标识 符 , 微 内 核 便 可 利用 系统 
映射 表 , 将 消息 发 往 目 标 ,而 无 论 目 标 是 驻 留 在 哪 台 计 算 机 上 。 


5) 融入 了 面向 对 象 技术 

在 设计 征 内 核 操作 系统 时 采用 了 面向 对 象 的 技术 ,其 中 的 继承 、 对 象 . 多 态 性 以 及 对 象 
之 间 的 消息 传递 机 制 等 都 十 分 有 利于 提高 系统 的 正确 性 、 可 靠 性 、 易 修改 性 、 易 扩展 性 等 ,而 
且 还 能 显著 地 减少 开发 系统 所 付出 的 开销 。 


3. 微 内 核 操 作 系 统 存在 的 问题 


应 当 指 出 ,在 微 内 核 操作 系统 中 采用 了 非常 小 的 内 核 以 及 客户 /服务 器 模式 和 消息 传递 
机 制 , 这 些 虽 给 微 内 核 操 作 系 统 带 来 了 许多 优点 ,但 由 此 也 使 微 内 核 操 作 系 统 存在 着 潜在 的 
缺点 。 其 中 最 主要 的 是 , 较 之 早期 操作 系统 , 微 内 核 操作 系统 的 运行 效率 有 所 降低 。 

效率 降低 最 主要 的 原因 是 ,在 完成 一 次 客户 对 操作 系统 提出 的 服务 请 求 时 ,需要 利用 消 
息 传递 机 制 实现 多 次 交互 和 进行 用 户 / 内 核 模式 及 上 下 文 的 多 次 切换 。 然 而 ,在 早期 的 操作 
系统 中 ,用 户 进程 在 请 求 取 得 操作 系统 服务 时 ,一般 只 需 进 行 两 次 上 下 文 的 切换 : 一 次 是 在 
执行 系统 调用 后 ,由 用 户 态 转向 系统 态 时 ; 另 一 次 是 在 系统 完成 用 户 请 求 的 服务 后 ,由 系统 
态 返 回 用户 态 时 。 在 微 内 核 操 作 系统 中 ,由 于 客户 和 服务 器 及 服务 器 和 服务 器 之 间 的 通信 
都 要 通过 微 内 核 , 致 使 同样 的 服务 请 求 至 少 需要 进行 4 次 上 下 文 切换 : 第 一 次 是 在 客户 发 
送 请 求 消息 给 内 核 ,以 请 求 取得 某 服务 器 特定 的 服务 时 ; 第 二 次 是 在 由 内 核 把 客户 的 请 求 
消息 发 往 服务 器 时 ; 第 三 次 是 当 服 务 器 完成 客户 请 求 后 ,把 响应 消息 发 送 到 内 核 时 ; 第 四 
次 是 在 内 核 将 响应 消息 发 送 给 客户 时 。 

实际 情况 是 服务 请 求 往往 还 会 引起 更 多 的 上 下 文 切换 。 例 如 , 当 某 个 服务 器 自身 无 能 
力 完 成 客户 请 求 ,而 需要 其 他 服务 器 的 帮助 时 ,如 其 中 的 文件 服务 器 还 需要 磁盘 服务 器 的 帮 
助 ,这 时 就 需要 进行 8 次 上 下 文 的 切换 。 

为 了 提高 运行 效率 ,可 以 把 一 些 常用 的 操作 系统 基本 功能 由 服务 器 移入 微 内 核 中 。 这 
样 可 使 客户 对 常用 操作 系统 功能 的 请 求 所 发 生 的 用 户 /内 核 模 式 和 上 下 文 的 切换 的 次 数 由 
4 次 或 8 次 降 为 2 次。 但 这 又 会 使 微 内 核 的 容量 明显 地 增 大 ,在 小 型 接口 定义 和 适应 性 方 
面 的 优点 也 有 所 下 降 , 同 时 也 提高 了 微 内 核 的 设计 代价 。 


1.5.3 虚拟 机 结构 


最 初 ,人 们 认为 分 时 系统 能 提供 两 个 功能 : 四 多 道 程序 处 理 能 力 ; 四 提供 一 个 比 裸 机 
有 更 方便 扩展 的 界面 的 计算 机 ,提供 这 个 功能 的 系统 被 称 为 虚拟 机 管理 程序 , 它 可 以 运行 在 
裸 机 上 ,并 且 具 备 多 道 程序 的 功能 ,向 上 层 提供 了 若干 台 虚 拟 机 ,如 图 1-12 所 示 。 

这 些 虚拟 机 是 裸 机 通过 (分 时 ) 复 用 硬件 资源 时 间 得 到 的 相同 的 硬件 复制 品 ,每 台 虚 拟 
机 都 与 裸 机 相同 ,所 以 每 台 虚 拟 机 上 都 可 以 运行 一 台 裸 机 所 能 够 运行 的 任何 类 型 的 操作 系 
统 , 不 同 的 虚拟 机 可 以 运行 不 同 的 操作 系统 。 当 每 一 个 操作 系统 运行 用 户 程序 执行 一 个 系 
统 调用 时 ,该 调用 被 陷 和 人 到 其 所 在 的 操作 系统 上 ,而 不 是 虚拟 机 管理 程序 上 ,似乎 它 运行 在 
实际 的 计算 机 上 ,而 不 是 在 虚拟 机 上 。 

在 20 世纪 90 年 代 , 由 于 虚拟 机 技术 的 复兴 ,出 现 了 一 种 新 型 的 虚拟 机 管理 程序 ,如 
图 1-13 所 示 ,与 运行 在 裸 机 上 的 虚拟 机 管理 程序 不 同 ,这 类 虚拟 机 管理 程序 作为 一 个 应 用 
程序 运行 在 Windows、Linux 或 其 他 操作 系统 之 上 ,这 些 系统 称 为 宿主 机 操作 系统 。 在 这 类 
虚拟 机 管理 程序 启动 后 ,从 安装 盘 中 读 和 人 供 选择 的 客户 操作 系统 ,并 安装 在 一 个 虚拟 盘 上 ， 
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该 盘 实 际 只 是 宿主 操作 系统 的 文件 系统 中 的 一 个 大 文件 。 客 户 操作 系统 启动 时 ,完成 在 硬 
件 上 相同 的 工作 ,如 启动 一 些 后 台 进 程 ,然后 是 启动 GUI。 由 管理 程序 翻译 客户 端的 二 进 
制程 序 ,翻译 后 的 程序 块 可 以 立即 执行 。 



































Excel Word MediaPlayer DBMS 客户 操作 系统 进程 
+ 
LO DJ OO 〇 ” 〇 ”_ 〇 | 主机 操作 系统 进程 
Windows Linux 客户 操作 系统 
I 型 虚拟 机 管理 程序 下 型 虚拟 机 管理 系统 OO 
裸 机 主机 操作 系统 
图 1-12 工 型 虚拟 机 管理 程序 图 1-13 本 型 虚拟 机 管理 系统 


虚拟 机 可 以 在 同一 人 台 计 算 机 上 运行 不 同类 型 的 操作 系统 ,例如 ,一 些 虚 拟 机 运行 大 型 的 
批 处 理 系统 , 男 一 些 运行 交互 式 的 分 时 系统 ; 也 可 以 在 同一 台 计 算 机 上 运行 许多 服务 器 ,如 
邮件 服务 器 、Web 服务 器 .FTP 服务 器 等 ,而 不 会 由 于 一 个 服务 器 崩溃 ,影响 到 其 他 的 系统 
Web 托管 公司 可 以 出 租 虚拟 机 ,一 台 物 理 计 算 机 就 可 以 运行 许多 虚拟 机 ,而 租用 虚拟 机 的 
客户 端 可 以 运行 自己 想 用 的 操作 系统 和 软件 ,只 需 支 付 少量 的 费用 。 

虽然 虚拟 机 操作 系统 有 着 诱 人 的 特性 ,但 是 它 最 突出 的 问题 是 实现 比较 困难 。 如 果 要 
实现 的 是 底层 硬件 的 完整 复制 , 即 它 要 模拟 硬件 几乎 所 有 的 特性 , 那 将 是 相当 困难 的 一 件 事 
情 。 因 此 现代 许多 商业 虚拟 机 采用 映射 部 分 指令 结合 直接 调用 宿主 操作 系统 功能 的 方法 ， 
但 这 样 必然 会 导致 虚拟 机 性 能 的 损失 ,所 以 虚拟 机 操作 系统 在 业界 是 非 主流 的 。 尽 管 如 此 ， 
虚拟 机 在 学 术 界 有 着 重要 意义 ,因为 它 是 研究 操作 系统 技术 的 理想 平台 。 


(6 Linux 操作 系统 


Linux 是 一 套 免费 使 用 和 自由 传播 的 类 UNIX 操作 系统 ,是 一 个 基于 POSIX 和 UNIX 
的 多 用 户 .多 任务 ,支持 多 线程 和 多 CPU 的 操作 系统 。 它 能 运行 主要 的 UNIX 工具 软件 、 
应 用 程序 和 网 络 协议 。 它 支持 32 位 和 64 位 硬件 。Linux 继承 了 UNIX 以 网 络 为 核心 的 设 
计 思 想 ,是 一 个 性 能 稳定 的 多 用 户 网 络 操作 系统 。 


1.6.1 Linux 发 展 历程 


1991 年 年 初 ,就 读 于 芬兰 的 赫尔辛基 大 学 (University of Helsinki) 的 Linus Torvalds 
正在 学 习 操作 系统 设计 这 门 课 程 ,他 可 以 通过 终端 使 用 学 校 提供 的 UNIX 操作 系统 服务 
器 ,但 学 校服 务 器 很 紧张 ,Torvalds 常常 用 不 上 服务 器 。 为 了 能 更 好 地 学 习 计 算 机 知识 ， 
Torvalds 贷款 购买 了 一 台 80386 兼容 服务 器 和 Minix 操作 系统 。 

为 了 能 通过 调制 解 调 器 拨号 连接 到 学 校 的 主机 上 ,并 且 有 更 好 的 性 能 ,直接 从 硬件 启动 
自己 的 程序 ,Torvalds 使 用 汇编 语言 和 C 语言 并 利用 80386 CPU 的 多 任务 特性 编制 出 一 个 
终端 仿真 程序 。Torvalds 可 以 使 用 这 个 终端 仿真 程序 登录 到 学 校 的 服务 器 上 ,收发 .阅读 
电子 邮件 ,参加 Minix 讨论 组 。 此 后 为 了 把 文件 保存 在 磁盘 中 ,查看 终端 仿真 程序 下 载 的 文 


件 , 他 还 编写 了 软盘 驱动 器 和 键盘 等 硬件 设备 的 驱动 程序 ,开发 了 自己 的 文件 系统 ,为 了 将 
自己 的 文件 上 传 到 Minix 系统 中 ,他 让 自己 的 文件 系统 可 以 和 Minix 文件 系统 兼容 。 随 着 
学 习 的 深入 ,他 的 系统 功能 不 断 增加 ,他 认识 到 Minix 系统 功能 过 于 简单 ,于 是 ,他 开始 有 了 
编制 一 个 操作 系统 的 想法 。 

为 了 能 更 好 地 开发 这 个 操作 系统 ,Torvalds 决定 通过 网 络 寻 求 帮助 ,1991 年 7 月 3 日 
他 在 一 个 名 为 comp. os. minix 的 讨论 组 中 发 了 一 个 帖子 : 

“各 位 网 友好 ! 我 现在 正在 Minix 系统 下 做 一 个 项 目 ,对 POSIX 标准 很 感 兴趣 。 有 谁 
能 向 我 提供 一 个 (最 好 ) 是 机 器 可 读 形式 的 最 新 的 POSIX 规则 ? 能 有 FTP 地 址 就 更 好 了 。” 

POSIX 是 Portable Operating System Interface( 可 移植 操作 系统 接口 ) 的 简称 ,POSIX 
是 由 IEEE(Institute of Electrical and Electronic Engineers, 电 子 和 电气 工程 师 协会 ) 制 定 的 
操作 系统 开发 标准 ,POSIX 为 不 同 平台 下 的 应 用 程序 提供 了 相同 的 API(Application 
Programming Interface, 应 用 编程 接口 ) ,一 个 完全 符合 POSIX 标准 的 应 用 程序 将 能 运行 在 
符合 POSIX 标准 的 不 同 的 操作 系统 上 。 

这 个 帖子 引起 了 赫尔辛基 理工 大 学 的 助教 Ari Lemke 的 注意 ,Ari Lemke 表示 愿意 在 
他 们 学 校 的 FTP 服务 器 上 为 Torvalds 提供 空间 , 建 一 个 子 目录 ,以 便 Torvalds 可 以 把 他 的 
操作 系统 发 布 上 去 ,让 感 兴趣 的 人 们 下 载 。 

Torvalds 全 身心 地 投入 到 系统 的 开发 中 去 ,他 自己 回忆 说 :“ 这 花费 了 我 大 量 的 精力 : 
编程 一 睡觉 一 吃饭 (饼干 ) 一 编程 ,那个 夏天 我 除了 伏 在 计算 机 面前 ,其 他 什么 都 没 做 。 有 时 
候 , 或 许 是 夜晚 ,我 会 从 床上 扑 起 来 ,直接 坐 到 离 床 仅 几 英 尺 远 的 计算 机 劳 。 毫 不 夸张 地 说 ， 
我 和 计算 机 之 外 的 世界 几乎 没有 任何 联系 。” 

1991 年 9 月 17 日 ,这 是 计算 机 发 展 史上 值得 纪念 的 一 天 ,Torvalds 将 自己 开发 的 系统 
源 程 序 完 整地 上 传 到 FTP 服务 器 上 , 供 大 家 下 载 测 试 。Torvalds 将 这 个 具有 划时代 意义 的 
操作 系统 命名 为 Linux 0. 01。 

在 开始 发 布 源 代码 时 ,Torvalds 就 制定 了 这 样 的 版 权 规则 : 

(1) 任何 人 都 可 以 免费 使 用 该 操作 系统 ,但 不 得 将 其 作为 商品 出 售 

(2) 任何 人 都 可 以 对 该 操作 系统 进行 修改 ,但 必 须 将 其 修改 以 源 代码 的 形式 公开 ， 

(3) 如 果 不 同意 以 上 规定 ,任何 人 无 权 对 其 进行 复制 或 从 事 任 何 行为 。 

显然 ,Torvalds 在 Linux 诞生 时 确定 的 版 权 规则 体现 了 开放 源 代 码 运动 的 基本 思想 ， 
在 Linux 诞生 的 初期 有 力 地 促进 了 它 的 传播 ,发展 .完善 ,吸引 了 网 络 上 越 来 越 多 的 程序 高 
手 加 入 到 Linux 的 测试 、 开 发 中 来 。 但 是 ,由 于 这 个 版 权 规则 禁止 销售 Linux, 实 际 上 又 阻 
碍 了 Linux 的 推广 ,传播 ,因为 软件 分 发 需要 时 间 、 精 力 ,物质 、 资 金 的 投入 ,如 果 一 味 禁 止 分 
发 者 获得 回报 ,必然 阻碍 Linux 的 推广 和 传播 ,使 得 Linux 最 终局 限 在 计算 机 软件 爱好 者 的 
小 范围 内 传播 ,无 法 到 达 普 通 计算 机 用 户 手中 。 

不 久 , Linux 的 机 遇 又 出 现 了 。Torvalds 有 机 会 聆听 了 自由 软件 运动 之 父 Richard 
Stallman 的 一 次 演讲 ,促使 他 考虑 转向 GNU 的 GPL(General Public License, 通 用 公共 许 
可 证 , 即 “ 反 版 权 ” 概 念 ) 。 

从 0.12 版 本 开始 ,Torvalds 把 GNU GPL 作为 Linux 的 版 权 声明 ,把 Linux 奉献 给 了 
自由 软件 ,奉献 给 了 GNU, 从 而 铸就 了 包括 Linux 在 内 的 自由 软件 今天 的 辉煌 。 从 此 ， 
Linux 走 上 迅速 发 展 的 康 庄 大 道 。 
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1.6.2 Linux 的 特点 
1. 多 用 户 、 多 任务 


Linux 支持 多 个 用 户 同时 使 用 同一 台 计 算 机 ,用 户 可 以 分 为 不 同 的 类 型 ,各 个 用 户 对 于 
自己 的 文件 设备 有 自己 特殊 的 权利 ,保证 了 各 用 户 之 间 互 不 影响 。 多 任务 是 指 Linux 可 以 
同时 并 独立 地 运行 几 个 任务 , 它 可 以 在 还 未 执行 完 一 个 任务 时 又 执行 另 一 项 任务 。Linux 
同时 具有 字符 界面 和 图 形 界 面 。 用 户 在 字符 界面 可 以 通过 键盘 输入 相应 的 指令 进行 操作 。 
它 同时 也 提供 了 类 似 Windows 图 形 界面 的 X Window 系统 ,用 户 可 以 使 用 鼠标 进行 操作 。 


2. 免费 .开源 


Linux 是 一 个 免费 的 操作 系统 ,用 户 可 以 通过 网 络 或 其 他 途径 免费 获得 ,并 可 以 任意 修 
改 其 源 代 码 。 正 是 由 于 这 一 点 ,来 自 全 世界 的 无 数 程序 员 参 与 了 Linux 的 修改 、 编 写 工 作 ， 
程序 员 可 以 根据 自己 的 兴趣 和 灵感 对 其 进行 改变 。 这 让 Linux 吸收 了 无 数 程序 员 的 精华 ， 
不 断 壮大 。 

另外 ,由 于 Linux 源 代码 公开 ,也 使 用 户 不 用 担心 有 “后 门 ” 等 安全 隐患 。 同 时 ,这 也 给 
各 教育 机 构 提 供 了 极 大 的 方便 ,从 而 也 促进 了 Linux 的 推广 和 应 用 。 


3. 系统 安全 稳定 


Linux 的 内 核 采用 模块 化 机 制 , 内 核 高 效 、 稳 定 。 其 设计 非常 精巧 ,分 成 进程 调度 、 内 存 
管理 .进程 间 通 信 、 虚 拟 文件 系统 和 网 络 接口 五 大 部 分 。 其 独特 的 模块 机 制 可 根据 用 户 的 需 
要 实时 地 将 某 些 模块 插入 或 从 内 核 中 移 走 ,使 得 Linux 系统 内 核 可 以 裁剪 得 非常 小 巧 , 很 适 
合 戏 入 式 系统 的 需要 。 

Linux 采取 了 许多 安全 技术 措施 ,其 中 有 读 写 权限 控制 .审计 跟踪 、 核 心 授 权 等 技术 ,这 
些 都 为 安全 提供 了 保障 。 


4. 丰富 安全 的 网 络 功 能 


互联 网 是 在 UNIX 的 基础 上 繁荣 起 来 的 ,Linux 是 类 UNIX 的 操作 系统 ,支持 各 种 标准 
的 网 络 协议 ,其 网 络 功能 也 非常 强大 。Linux 的 网 络 功能 和 其 内 核 紧 密 相连 ,Linux 中 大 量 
网 络 管理 、 网 络 服务 等 方面 的 功能 可 使 用 户 很 方便 地 建立 高 效 稳定 的 防火 墙 、. 路 由 器 .工作 
站 、 服 务 器 等 。 为 提高 安全 性 , 它 还 提供 了 大 量 的 网 络 管理 软件 、 网 络 分 析 软 件 和 网 络 安全 
软件 等 。 


5. 支持 多 种 平台 


Linux 能 支持 x86、ARM、MIPS、ALPHA 和 PowerPC 等 多 种 体系 结构 的 微 处 理 器 。 
目前 已 成 功 地 移植 到 数 十 种 硬件 平台 ,几乎 能 运行 在 所 有 流行 的 处 理 器 上 。 它 完全 兼容 
UNIX, 目 前 在 Linux 中 所 包含 的 工具 和 实用 程序 可 以 完成 UNIX 的 所 有 主要 功能 。 

此 外 ,Linux 还 是 一 种 嵌入 式 操 作 系 统 ,可 以 运行 在 掌上 电脑 .机 顶 盒 或 游戏 机 上 。 赔 
入 式 Linux 为 开发 者 提供 了 一 套 完整 的 工具 链 (tool chain) ,能 够 很 方便 地 实现 从 操作 系统 





到 应 用 软件 各 个 级 别 的 调试 。 同 时 Linux 也 支持 多 处 理 器 技术 。 多 个 处 理 器 同时 工作 ,使 
系统 性 能 大 大 提高 。 另 一 方面 :由 于 Linux 有 很 好 的 文件 系统 支持 (例如 , 它 支持 Ext2、 
FAT32 ,romfs 等 文件 系统 ) ,是 数据 备份 .同步 和 复制 的 良好 平台 ,这 些 都 为 开发 嵌入 式 系 
统 应 用 打下 了 坚实 的 基础 。 


6. Linux 的 不 足 


由 于 在 现在 的 个 人 计算 机 操作 系统 行业 中 ,微软 公司 的 Windows 系统 仍然 占有 最 大 的 
份额 , 绝 大 多 数 的 软件 公司 都 支持 Windows, 这 使 得 Windows 上 的 应 用 软件 应 有 尽 有 ,而 
针对 其 他 操作 系统 的 应 用 软件 就 要 少 一 些 。 

软件 支持 的 不 足 是 Linux 最 大 的 缺憾, 但 随 着 Linux 的 发 展 , 越 来 越 多 的 软件 厂商 会 支 
持 Linux, 它 应 用 的 范围 也 越 来 越 广 。 可 以 预见 ,这 只 “小 企鹅 ”的 前 景 将 是 十 分 光明 的 。 


1.6.3 Linux 内 核 结构 


Linux 采用 模块 机 制 ,可 以 方便 地 将 模块 装 人 内 核 或 从 内 核 中 印 下 。 整 个 Linux 系统 
内 核 由 许多 过 程 组 成 ,每 个 过 程 可 以 独立 编译 ,然后 用 链接 程序 将 其 链接 为 单独 的 目标 程 
序 。 每 个 过 程 对 其 他 过 程 都 是 可 见 的 ,不 同 的 人 可 参与 不 同 过 程 的 开发 。 

Linux 内 核 由 5 个 主要 的 子 系统 组 成 ,如 图 1-14 所 示 。 
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1-14 Linux 内 核 的 子 系统 及 相互 之 间 的 关系 


(1) 进程 调度 (SCHED) 子 系统 控制 着 进程 对 CPU 的 访问 。 当 需要 选择 下 一 个 进程 运 
行 时 ,由 调度 程序 选择 最 值得 运行 的 进程 。 可 运行 进程 是 指 仅 等 待 CPU 资源 的 进程 ,如 果 
某 个 进程 在 等 待 其 他 资源 , 则 该 进程 是 不 可 运行 进程 。Linux 使 用 了 比较 简单 的 基于 优先 
级 的 进程 调度 算法 选择 新 的 进程 。 

(2) 内 存 管理 (MM) 子 系统 允许 多 个 进程 安全 地 共享 主 内 存 区 域 。Linux 的 内 存 管理 
支持 虚拟 内 存 , 即 在 计算 机 中 运行 的 时 候 , 其 代码 数据 和 堆栈 的 总 量 可 以 超过 实际 内 存 的 
大 小 ,操作 系统 只 将 当前 使 用 的 程序 块 保留 在 内 存 中 ,其 余 的 程序 块 则 保留 在 磁盘 上 。 必 要 
时 ,操作 系统 负责 在 磁盘 和 内 存 之 间 交 换 程序 块 。 
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内 存 管理 从 迎 辑 上 可 以 分 为 与 硬件 无 关 的 部 分 和 与 硬件 相关 的 部 分 ,与 硬件 无 关 的 部 
分 提供 了 进程 的 映射 和 虚拟 内 存 的 对 换 ,与 硬件 相关 的 部 分 为 管理 内 存 硬 件 提供 了 虚拟 
接口 。 

(3) 虚拟 文件 系统 (VFS) 隐 藏 了 各 种 不 同 硬件 的 具体 细节 ,为 所 有 设备 提供 了 统一 的 
接口 ,VFS 还 支持 多 达 数 十 种 不 同 的 文件 系统 ,这 也 是 Linux 较 有 特色 的 一 部 分 。 虚 拟 文 
件 系 统 分 为 逻辑 文件 系统 和 设备 驱动 程序 。 人 逻辑 文件 系统 指 Linux 所 支持 的 文件 系统 ,如 
Ext2、FAT 等 ,设备 驱动 程序 指 为 每 一 种 硬件 控制 器 所 编写 的 设备 驱动 模块 。 

(4) 网 络 (NET) 子 系统 提供 了 对 各 种 网 络 标准 的 存 取 和 各 种 网 络 硬件 的 支持 。 网 络 接 
口 可 分 为 网 络 协议 和 网 络 设备 驱动 程序 两 部 分 。 网 络 协议 负责 实现 每 一 种 可 能 的 网 络 传输 
协议 ,网 络 设备 驱动 程序 负责 与 硬件 设备 进行 通信 ,各 种 可 能 的 硬件 设备 都 有 相应 的 驱动 
程序 。 

(5) 进程 间 通信 (IPC) 子 系统 支持 进程 间 各 种 通信 机 制 。 

从 图 1-14 可 以 看 出 ,处 于 中 心 位 置 的 是 进程 调度 ,所 有 其 他 的 子 系统 都 依赖 于 它 , 因 为 
每 个 子 系统 都 需要 挂 起 或 恢复 进程 。 一 般 情 况 下 ,一 个 进程 在 等 待 硬件 操作 完成 时 被 挂 起 ， 
在 操作 真正 完成 时 被 恢复 执行 。 例 如 , 当 一 个 进程 通过 网 络 发 送 一 条 消息 时 ,网 络 子 系统 需 
要 挂 起 发 送 进程 ,直到 硬件 成 功 地 完成 消息 的 发 送 , 当 消息 被 发 送出 去 以 后 ,网 络 子 系统 给 
进程 返回 一 个 代码 ,表示 操作 的 成 功 或 失败 。 其 他 子 系统 (内 存 管理 、 虚 拟 文件 系统 及 进程 
间 通 信 ) 以 相似 的 理由 依赖 于 进程 调度 。 除 了 图 1-14 所 显示 的 依赖 关系 外 ,内 核 中 的 所 有 
子 系统 还 要 依赖 一 些 共同 的 资源 ,这 些 资源 包括 所 有 子 系统 都 用 到 的 过 程 ,例如 分 配 和 释放 
内 存 空间 的 过 程 、 打 印 警 告 或 错误 信息 的 过 程 、 系 统 的 调试 例 程 等 ,这 些 过 程 在 图 1-14 中 没 
有 显示 。 


习题 


. 是 什么 促进 了 操作 系统 的 形成 和 发 展 ? 操作 系统 的 发 展 经 历 了 哪些 阶段 ? 
. 什么 是 操作 系统 ? 操作 系统 具有 哪些 功能 ? 

. 从 交互 性 、 及 时 性 和 可 靠 性 方面 比较 批 处 理 系 统 、 分 时 系统 和 实时 系统 。 
. 什么 是 分 布 式 操作 系统 ? 分 布 式 操作 系统 有 什么 特点 ? 

. 什么 是 嵌入 式 操作 系统 ? 赃 入 式 操作 系统 有 什么 特点 ? 

. 实时 系统 有 什么 特点 ? 

. 分 时 系统 有 什么 特点 ? 

. 什么 是 多 道 程序 ? 单 处 理 机 系统 中 的 多 道 程序 有 什么 特点 ? 

.操作 系统 与 用 户 程序 之 间 具 有 怎样 的 关系 ? 

10. 微 内 核 操 作 系 统 中 包括 哪些 主要 的 操作 功能 ? 

11. 微 内 核 操 作 系 统 有 哪些 优势 和 不 足 ? 

12. Linux 有 什么 特点 ? 

13. Linux 内 核 的 主要 模块 有 哪些 ? 


ci oo 加 四 必 mb 





用 户 接口 是 用 户 与 计算 机 系统 交互 的 环境 和 方式 。 为 了 方便 用 户 使 用 计算 机 系统 , 操 
作 系 统 向 用 户 提供 了 直接 使 用 计算 机 系统 的 手段 ,通常 称 为 用 户 接口 。 用 户 通过 操作 系统 
提供 的 接口 与 计算 机 系统 交互 , 即 用 户 通 过 一 定 的 方式 和 途径 ,将 自己 的 要 求 告诉 计算 机 ， 
而 计算 机 根据 用 户 不 同 的 要 求 完成 相应 的 操作 和 处 理 。 

通常 操作 系统 为 用 户 提供 两 类 接口 。 一 类 是 系统 为 用 户 提供 的 各 种 命令 控制 界面 ,用 
户 利用 这 些 操作 命令 来 组 织 和 控制 程序 的 执行 或 管理 计算 机 系统 。 另 一 类 是 程序 接口 , 编 
程 人 员 在 程序 中 通过 程序 接口 来 请 求 操作 系统 提供 服务 。 

本 章 主 要 讨论 操作 系统 为 用 户 提供 的 命令 控制 界面 和 程序 接口 。 


6.i 命令 控制 界面 


当今 几乎 所 有 的 操作 系统 都 向 用 户 提供 了 各 种 联机 的 命令 控制 界面 。 用 户 通过 输入 设 
备 (键盘 、 鼠 标 、 触 摸 屏 、 声 音 等 ) 发 出 一 系列 命令 交互 地 组 织 和 控制 程序 的 执行 或 管理 计算 
机 系统 。 


2.1.1 联机 命令 的 类 型 


为 了 能 向 用 户 提供 多 方面 的 服务 ,通常 操作 系统 都 向 用 户 提供 了 几 十 条 甚至 上 百 条 的 
联机 命令 。 根 据 这 些 命令 所 完成 的 功能 不 同 , 可 把 它们 分 成 以 下 几 类 : 

(1) 系统 访问 。 在 多 用 户 系 统 中 ,为 了 保证 系统 的 安全 性 ,都 设置 了 系统 访问 命令 , 即 
注册 命令 Login。 用 户 每 次 使 用 某 个 终端 时 ,都 必须 先 使 用 该 命令 ,使 系统 能 识别 该 用 户 。 
当 用 户 退 出 系统 时 ,使 用 注销 命令 Logout 退出 系统 。 

(2) 目录 和 文件 管理 。 该 类 命令 用 来 管理 和 控制 终端 用 户 文件 或 目录 文件 。 例 如 , 复 
制 、 移 动 和 删除 某 个 文件 或 目录 文件 ,或 者 显示 和 查找 某 个 文件 或 目录 。 

(3) 编译 和 链接 装配 。 用 户 使 用 这 类 命令 把 用 户 输入 的 源 程序 文件 编译 链接 成 可 执行 
程序 。 

(4) 维护 管理 命令 。 该 类 命令 一 般 为 管理 员 使 用 ,主要 用 于 系统 维护 、 开 机 、 关 机 、 增 加 
和 减少 用 户 、 计 时 收费 等 。 

(5) 通信 。 该 类 命令 在 单机 系统 中 用 来 进行 主机 和 远程 终端 之 间 的 呼叫 、 连 接 以 及 断 
开 等 ,从 而 在 主机 和 远程 终端 之 间 建 立会 话 信道 。 在 网 络 系统 中 ,通信 命令 除了 用 来 进行 有 
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关 信 道 的 呼叫 、 连 接 以 及 断 开 等 之 外 ,还 进行 主机 和 主机 之 间 的 信息 发 送 与 接收 、 显 示 等 
工作 。 

(6) 其 他 。 包 括 建立 和 查看 日 期 时间 ,修改 和 设置 外 设 参数 等 命令 。 

联机 控制 方式 使 用 户 直接 控制 程序 执行 ,因而 大 大 地 方便 了 用 户 。 但 是 ,在 某 些 情况 
下 ,用 户 反复 输入 众多 的 命令 也 会 感到 非常 烦琐 或 浪费 了 许多 不 必要 的 时 间 。 例 如 ,在 对 某 
个 源 代 码 文件 进行 编译 调试 之 后 ,需要 重新 和 多 个 目标 代码 文件 链接 。 如 果 这 个 调试 和 链 
接 不 是 一 次 成 功 的 话 (这 种 情况 经 常 发 生 ) ,那么 ,用 户 的 控制 过 程 将 会 非常 单调 和 烦琐 。 显 
然 ,在 这 种 情况 下 , 批 处 理 方式 要 优 于 联机 控制 方式 。 因 此 ,在 现代 操作 系统 中 ,大 都 提供 批 
处 理 方式 和 联机 控制 方式 。 这 里 , 批 处 理 方式 既 指 传统 的 作业 控制 语言 编写 的 作业 说 明 书 
方式 ,也 指 那些 把 不 同 的 交互 命令 按 一 定格 式 组 合 后 的 命令 文件 方式 。 


2.1.2 联机 命令 的 操作 方式 


目前 ,大 多 数 操作 系统 提供 了 两 种 联机 命令 的 操作 方式 ,包括 输入 式 命令 方式 和 选择 式 
命令 方式 ,它们 针对 不 同 的 屏幕 显示 环境 ,方便 用 户 的 选择 和 使 用 。 


1. 输入 式 命令 


输入 式 命令 通常 指 来 自控 制 台 和 终端 输入 的 操作 命令 , 它 是 一 种 命令 行 操作 方式 (文本 
行 方式 ), 操 作者 以 字符 串 形 式 输入 命令 ,并 等 待 该 命令 的 响应 和 执行 。 在 单 任务 环境 下 ,每 
次 只 能 输入 一 条 命令 ,只 有 当 该 命令 功能 完成 后 ,操作 者 才能 输入 第 二 条 命令 。 如 果 操 作 系 
统 提 供 多 命令 缓冲 支持 以 及 在 多 任务 环境 和 分 布 式 环境 下 的 多 命令 支持 ,操作 者 可 以 连续 
输入 若干 条 命令 ,不必 等 待 每 条 指令 的 执行 。 对 于 输入 式 命令 ,操作 者 必须 记 住 其 命令 名 、 
字符 串 形式 及 命令 行 参数 ,并 在 输 盘 上 一 一 输入 ,这 是 输入 式 命令 的 缺点 。 

这 种 命令 行 操作 方式 是 一 种 简捷 的 命令 语言 ,适合 有 经 验 的 用 户 , 大 多 数 操作 系统 都 具 
有 这 样 的 命令 语言 。 例 如 ,著名 的 Linux 中 的 命令 就 是 一 种 文本 行 式 命令 语言 , 它 对 于 熟悉 
它 的 用 户 来 说 极为 方便 。 

在 当今 几乎 所 有 的 计算 机 操作 系统 中 都 向 用 户 提供 了 输入 式 命令 。 用 户 需要 操作 系统 
提供 服务 时 , 先 在 终端 的 键盘 上 输入 所 需 的 命令 ,由 终端 处 理 程序 接收 该 命令 ,将 用 户 输入 
的 字符 放 和 人 缓冲 区 ,同时 提供 字符 编辑 并 显示 在 终端 屏幕 上 ,以 便 用 户 查看 。 当 一 条 命令 输 
入 完成 后 ,命令 解释 程序 对 命令 进行 分 析 , 然 后 执行 相应 的 处 理 程序 。 

在 所 有 的 操作 系统 中 ,都 把 命令 解释 程序 放 在 操作 系统 的 最 高 层 , 以 使 能 直接 与 用 户 交 
互 。 命 令 解 释 程 序 通 常 按 两 种 方法 解释 执行 输入 的 命令 。 一 种 方法 是 由 命令 解释 程序 查找 
命令 表 , 得 到 该 命令 的 处 理 程序 人 口 地 址 ,然后 由 解释 程序 调用 相应 的 处 理 程序 直接 执行 。 
这 一 般 是 那些 最 常用 的 而 且 处 理 程序 比较 短小 的 命令 ,. 即 常用 的 内 部 命令 。 另 一 种 方法 是 
为 输入 的 命令 建立 一 个 子 进程 ,由 子 进 程 执行 对 应 的 命令 。 这 一 般 是 文本 编辑 .程序 编译 以 
及 运行 各 种 实用 程序 和 用 户 程序 等 命令 , 即 命令 程序 较 大 ,用 到 时 才 从 外 存 调 入 内 存 的 外 部 
命令 。 


2. 选择 式 命令 
选择 式 命令 是 在 用 户 界面 向 可 视 化 发 展 过 程 中 引入 的 一 种 命令 选择 和 执行 方式 。 选 择 
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式 命令 不 需要 用 户 输入 命令 名 ,操作 者 只 需 根据 不 同 的 输入 和 选择 设备 选择 所 需 的 命令 名 ， 
系统 根据 用 户 的 选择 进入 命令 的 解释 执行 ,任务 完成 后 再 返回 原 操作 环境 。 

在 视窗 环境 推出 后 ,选择 式 命令 的 方式 得 到 了 广泛 的 应 用 。 视 窗 环境 是 一 种 面向 屏幕 
的 命令 交互 接口 , 它 的 主体 是 菜单 系统 ,所 有 的 系统 命令 、 操 作 信 息 以 及 各 种 控制 功能 操作 
都 出 现在 命令 菜单 中 ,由 用 户 根据 需要 从 系统 提供 的 命令 中 挑选 一 种 。 这 对 新 入 门 的 用 户 
非常 有 用 ,因为 他 们 不 须 记 住 命令 名 ,在 某 些 特定 的 应 用 中 ,如 文本 编辑 \ 程 序 编写 时 ,这 种 
方式 最 为 方便 。 然 而 ,菜单 系统 会 限制 用 户 使 用 命令 的 数量 ,因为 显示 菜单 会 占用 额外 的 存 
储 空间 和 时 间 。 

视窗 型 命令 界面 是 当今 操作 系统 所 具有 的 良好 的 用 户 交互 界面 ,是 系统 可 视 化 的 基础 ， 
所 以 在 操作 系统 领域 很 快 得 到 推广 。 例 如 ,无 论 是 Windows 系列 还 是 UNIX 系列 的 操作 系 
统 , 它 们 的 命令 控制 界面 都 是 由 多 窗口 的 按钮 式 图 形 界面 组 成 。 在 这 些 系统 中 ,命令 已 被 设 
计 成 一 条 条 能 用 点 击 方式 执行 的 简单 的 菜单 或 小 巧 的 图 标 。 而 且 , 用 户 也 可 以 在 命令 提示 
符 下 用 普通 字符 方式 输入 各 种 命令 。 最 近 , 用 声音 控制 的 命令 控制 界面 也 已 开发 出 来 。 计 
算 机 系统 的 命令 控制 界面 将 会 越 来 越 方 便 和 越 来 越 人 性 化 。 


@.3 Linux 系统 的 命令 控制 界面 


Linux 系统 具有 丰富 的 操作 命令 ,这 些 命令 都 通过 Shell 提供 给 用 户 使 用 。Shell 是 
Linux 系统 为 用 户 提供 的 键盘 命令 和 解释 程序 的 集合 。Linux 通过 Shell 提供 了 300 多 个 
命令 ,限于 篇 幅 , 本 节 只 介绍 Linux 系统 的 常用 命令 ,以 使 读者 对 Linux 系统 命令 有 初步 的 
了 解 。 


2.2.1 登录 Shell 
用 户 在 进入 Linux 系统 之 前 必须 登录 。 当 用 户 打开 终端 后 ,系统 便 会 显示 如 下 信息 : 





login: 
用 户 在 输入 用 户 名 后 ,系统 显示 
password: 


在 用 户 输入 完 口令 后 ,系统 检查 用 户 名 和 口令 是 否 正确 ,如 果 正 确 , 系 统 将 启动 该 用 户 
的 Shell 程序 ,并 在 屏幕 上 出 现 Shell 提示 符 , 如 下 所 示 : 


$ 


注意 : $$ 是 系统 默认 的 提示 符 。 用 户 可 随 自己 的 喜好 改变 提示 符 的 显示 形式 。 

然后 ,用 户 可 在 提示 符 后 输入 各 种 各 样 的 命令 ,由 Shell 解释 和 执行 用 户 的 命令 。 当 用 
户 的 一 条 命令 执行 完 后 ,系统 返回 Shell 提示 符 ,等待 用 户 输入 下 一 条 命令 ,如 此 循环 ,直到 
用 户 退 出 系统 。 

用 户 在 完成 工作 之 后 ,一 般 应 退出 系统 。 这 样 做 主要 是 为 了 安全 。 因 为 ,如 果 某 个 用 户 
离开 终端 时 没有 从 系统 中 注销 ,那么 其 他 用 户 就 能 继续 利用 那个 没有 终止 的 Shell 使 用 计 
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算 机 ,从 而 系统 中 的 用 户 数据 就 有 可 能 被 破坏 或 失窃 。 从 系统 中 注销 实际 上 是 将 相应 的 
Shell 程序 终止 ,方法 是 在 提示 符 后 按 Ctrl 十 D 键 ,或 者 输入 logout 或 exit 命令 。 


2.2.2 命令 句法 

为 了 使 用 户 的 要 求 能 被 Linux 系统 理解 ,每 条 命令 必须 以 正确 的 格式 表示 ,或 者 说 必须 
遵循 命令 行 句 法 。Linux 系统 命令 以 小 写字 母 构成 ,注意 ,Linux 系统 区 分 大 小 写字 母 ( 这 
一 点 与 Windows 不 同 ) 。Linux 系统 的 命令 句法 如 下 : 

command [option] [arguments] < CR> 
其 中 ,command 是 用 户 要 求 系统 执行 的 命令 名 称 ; option 是 选项 ,用 于 改变 命令 的 执行 方 
式 ,一 条 命令 可 以 有 多 个 选项 ; arguments 是 命令 的 操作 对 象 , 它 规定 了 命令 所 操作 的 数据 ; 
< CR > 表示 按 回 车 键 。 例 如 ,命令 

ls -1 file 
要 求 系统 以 详细 列表 方式 显示 文件 file 的 目录 。 其 中 ,ls 是 命令 名 称 ,-1 是 选项 ,file 是 操作 
对 象 。 

2.2.3 常用 的 基本 命令 

1. 显示 当前 工作 目录 命令 pwd 

Linux 系统 大 多 数 命令 默认 在 当前 目录 下 对 文件 进行 操作 。 用 户 时 常 需要 知道 自己 在 
文件 系统 中 所 处 的 位 置 。 命 令 pwd 用 于 显示 用 户 当前 所 在 的 目录 。 例 如 : 

$ pwd 

/home/student/txt 

显示 出 当前 所 在 的 工作 目录 。pwd 以 绝对 路 径 名 (以 “/” 开 头 的 路 径 名 ) 的 形式 显示 当前 工 
作 目 录 。 

2. 列 目录 命令 ls 

ls 的 意义 为 列表 (list) ,也 就 是 将 某 一 个 目录 内 容 以 列表 的 形式 显示 出 来 。 

如 果 在 1s 命令 后 面 没 有 任何 参数 , 它 将 会 显示 出 当前 目录 中 所 包含 的 文件 名 ,而 不 指 
出 是 文件 还 是 目录 。 

也 可 以 在 ls 后 面 加 上 所 要 查看 的 文件 名 称 ,例如 : 


$ 1s /home/txt (将 显示 绝对 路 径 /home/txt 下 包含 的 内 容 ) 
$ 1s prol (将 显示 当前 工作 目录 下 的 子 目录 prol 中 包含 的 内 容 ) 
$ 1s * .jan (将 显示 当前 工作 目录 下 所 有 扩展 名 为 jan 的 文件 ) 


在 Linux 系统 中 提供 了 3 种 文件 名 的 通配符 : * 、? 和 [...]。* 可 以 和 任意 字符 串 相 匹 
配 ,? 和 文件 名 中 单个 字符 匹配 ,[...] 匹 配 集合 内 的 任意 字符 。 因 此 ,在 指定 文件 名 时 可 以 
使 用 通配符 来 简化 输入 。 

ls 有 一 些 特别 的 参数 ,可 以 给 出 有 关 文 件 除 文件 名 外 的 其 他 信息 。 常 用 的 参数 如 下 : 
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-a: 在 Linux 中 ,车 一 个 目录 或 文件 的 名 字 的 第 一 个 字符 为 “.”, 则 表示 文件 是 隐 含 的 ， 
列 目录 时 ,这 些 文件 一 般 不 显示 出 来 。 使 用 1s -a 可 显示 这 类 文件 。 

-F :该 选项 可 在 文件 名 后 显示 适当 的 符号 以 指明 文件 的 类 型 。 可 执行 文件 用 * 表示 ， 
目录 文件 用 /表示 ,链接 文件 用 @ 表 示 ,例如 : 

$1s -了 

letters/ memo@ test* notes 

可 以 看 出 ,当前 目录 下 包含 子 目 录 letters、 链 接 文件 memo、 执 行文 件 test 和 普通 文件 
notes 。 

-1: 这 个 参数 代表 使 用 1s 的 长 (long) 格 式 , 可 以 显示 更 多 的 文件 信息 ,如 文件 的 存 取 权 
限 文件 拥有 者 (owner) ,文件 大 小 等 。 例 如 : 




















drwx-—x--x 2 student groupl 325 Nov 29 05:08 letters 

lrwx—-—x-—-x 2 student groupl 288 hg 8 22:00 memos 

Ns 1 student groupl 566 Aug 10 06:28 test 

-Bs 1 student groupl 266 Feb 12 05:28 notes 

每 一 行 是 一 个 文件 的 信息 。 每 一 行 划分 成 不 同 的 段 ,从 左 到 右 的 各 段 分 别 表示 文件 的 
种 类 和 文件 的 存 取 权 限 、 链 接 的 文件 数 文件 主 名 文件 所 在 的 组 \ 文 件 大 小 ,文件 的 创建 时 
间或 修改 时 间 ( 月 .日 和 时 分 ) ,文件 名 。 

每 行 的 第 1 个 字符 指明 了 文件 的 种 类 : -表示 普通 文件 ,d 表示 目录 文件 ,b 表示 块 设备 
文件 ,c 表示 字符 设备 文件 ,1 表示 符号 链 文件 ,p 表示 管道 文件 。 

ls 可 以 同时 带 多 个 选项 ,例如 : 

$1s -aF 

.mailcx letters/ 

在 Linux 系统 中 ,“, ”和 *“.. ”分 别 表示 当前 目录 及 其 父 目 录 , 本 例 显 示 了 两 个 目录 “. ”和 
“,.”\ 隐 含 的 可 执行 文件 mailc 和 目录 文件 letters。 

这 种 多 个 选项 的 组 合 方法 不 仅 适用 于 ls 命令 ,也 适用 于 多 数 的 Linux 命令 ,并 且 选 项 
的 组 合 数量 没有 限制 。 


3. 复制 文件 命令 cp 


cp 的 意义 是 复制 (copy) ,也 就 是 将 一 个 或 多 个 文件 复制 成 男 一 个 文件 或 者 是 将 其 复制 
到 另 一 个 目录 中 。cp 的 用 法 如 下 : 


$ cp fl f2 (将 文件 名 为 f1 的 文件 复制 为 文件 名 为 f2 的 文件 ) 

$cp 一 ifl f2 (如 果 在 当前 目录 下 已 有 一 个 名 为 f2 的 文件 , 重 写 文件 f2 时 提示 是 否 重 写 文件 ) 
$cp fl f2 f3 dir (将 文件 绊 、 人 2、f3 以 相同 的 文件 名 复制 一 份 放 到 目录 dir 中 ) 

$cp -rdirl dir2 (将 目录 dirl 的 全 部 内 容 全 部 复制 到 目录 dir2 中 ) 


4. 移动 文件 和 更 改 文件 名 命令 mv 
mv 的 意义 为 移动 (move), 主要 是 将 一 个 文件 改名 或 换 至 另 一 个 目录 。mv 的 用 法 
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™ 
如 下 ， 


$mv fl f2 (将 名 为 1 的 文件 变更 成 名 为 f2 的 文件 ) 
$mv dirl dir2 (将 名 为 dirl 的 目录 变更 成 名 为 dir2 的 目录 ) 
$mv fl f2 f3 dir (将 文件 和 代 \f2.f3 都 移 至 目录 dir 中 ) 


my 的 参数 有 两 个 : -f 和 -i, 其 中 -i 的 意义 与 cp 中 的 相同 , 均 是 询问 (interactive) 之 意 。 
而 -f 为 强制 (force) ,就 是 不 管 有 没有 同名 的 文件 , 均 强 制 移动 文件 ,所 有 其 他 的 参数 遇 到 -f 
均 会 失效 。 

5. 删除 文件 命令 rm 


rm 的 意义 是 删除 (remove) ,用 来 删除 一 个 文件 。 在 Linux 中 一 个 被 删除 的 文件 除非 是 
系统 恰好 有 备份 ,否则 无 法 像 在 Windows 里 面 一 样 还 能 够 恢复 ,所 以 在 执行 rm 操作 的 时 
候 要 特别 小 心 。 

rm 的 格式 如 下 : 


$ rm fl f2 £3 (将 文件 日 .f2 ,f3 同时 删除 ) 
rm 的 常用 参数 是 -f、-i。 

-f: 在 删除 时 不 提出 任何 警告 。 

-i: 在 删除 前 均 会 询问 是 否 真 要 删除 。 

6. 建立 目录 命令 mkdir 

mkdir 是 用 于 建立 目录 的 命令 。 可 以 在 一 个 目录 下 使 用 mkdir 建立 一 个 子 目 录 , 用 法 
如 下 : 


mkdir dirnamel [ dirname2 … ] 


7. 改变 当前 工作 目录 命令 cd 
该 命令 可 改变 当前 工作 目录 。 用 法 如 下 : 
cd dirname 
将 当前 工作 目录 改 为 dirname 目录 。 可 以 使 用 cd. . 命令 转移 到 父 目 录 。 
8. 查看 文件 内 容 命令 cat 和 more 


查看 一 个 文件 最 简单 的 方法 是 执行 cat 命令 。cat 将 用 户 指 定 的 文件 内 容 全 部 显示 在 
屏幕 上 。 

例如 : 

$ cat hello 

Hello! This is a test! 

较 长 的 文件 会 快速 滚 过 屏幕 而 无 法 看 清 。more 命令 可 以 将 要 查看 的 文件 内 容 逐 页 显 
示 出 来 ,可 根据 用 户 的 需要 翻 页 或 卷 动 。more 的 用 法 如 下 : 
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more filename 


要 向 前 翻 一 屏 , 可 以 按 空格 键 ; 要 向 前 移 一 行 ,可 以 按 回 车 键 ; 如 果 要 结束 查看 ,可 以 
按 q 键 退出 。 





9. 改变 文件 存 取 权限 命令 chmod 


在 Linux 系统 中 ,一 个 文件 上 有 可 读 (r) 、 可 写 (w) 、 可 执行 (x) 3 种 执行 模式 ,分 别针 对 
该 文件 的 拥有 者 (onwer) 、 同 组 者 (group member) 以 及 其 他 人 (other)。chmod 用 来 变更 文 
件 的 执行 模式 ,其 用 法 如 下 : 


chmod [who] op - code permission filename 
其 中 ,[Lwho] 用 于 指明 访问 者 的 身份 ,可 以 是 用 户 自己 、 用 户 组 .所 有 其 他 用 户 及 全 部 ,分 别 
用 ug.o 和 a 表示; op-code 是 操作 码 , 分 别 用 十 .一 及 三 表示 增加 、 取 消 及 赋予 访问 者 某 种 
权限 ; permission 是 权限 ,分别 用 rw 及 x 表 示 读 、 写 及 执行 权限 。 例 如 : 

$ chmod go — w temp 
表示 取消 用 户 组 及 所 有 其 他 用 户 对 文件 temp 的 写 权 限 。 

10. 联机 帮助 命令 man 

用 户 可 通过 man 命令 来 获得 联机 帮助 ,用 法 如 下 : 

man titil 
显示 titi 命令 的 使 用 方法 。 

例如 : 

$man man( 显 示 man 命令 的 联机 帮助 ) 


2.2.4 重 定向 与 管道 命令 
1. 重 定向 命令 


Linux 系统 定义 了 两 个 称 为 标准 输入 和 标准 输出 的 文件 ,分 别 对 应 终端 键盘 输入 和 终 
端 屏幕 输出 。 它 们 是 在 用 户 注册 时 由 Login 程序 打开 的 。 这 样 , 在 用 户 程序 执行 时 , 隐 含 的 
标准 输入 是 键盘 输入 ,标准 输出 是 屏幕 显示 。 但 用 户 程序 中 可 能 不 要 求 从 键盘 输入 ,而 是 从 
某 个 指定 文件 上 读 取 信息 供 程序 使 用 ; 同样 ,用 户 可 能 希望 把 程序 执行 时 所 产生 的 结果 数 
据 写 到 某 个 指定 文件 中 而 非 屏幕 上 。 这 时 用 户 必须 改变 输入 与 输出 文件 , 即 不 使 用 标准 输 
入 ,标准 输出 ,而 是 把 男 外 的 某 个 文件 或 设备 作为 输入 或 输出 文件 。 

Shell 向 用 户 提 供 了 这 种 用 于 改变 输入 、 输 出 设备 的 手段 , 即 标 准 输入 与 标准 输出 的 重 
定向 。 用 重 定向 符 “<” 和 “二 ”分 别 表示 输入 转向 和 输出 转向 。 例 如 : 





$ cat filel 


表示 将 文件 filel 的 内 容 在 标准 输出 上 显示 出 来 。 
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$cat filel > file2 


表示 把 文件 filel 的 内 容 输出 到 文件 file2 中 。 

必须 指明 的 是 ,在 输出 转向 时 ,车 指定 的 文件 file2 并 不 存在 , 则 系统 先 创建 它 ; 若 已 存 
在 , 则 系统 认为 它 是 空白 的 ,执行 上 述 输出 转向 命令 时 ,用 命令 的 输出 数据 重 写 该 文件 ,此 
时 ,如 果 文 件 file2 已 有 内 容 , 则 命令 执行 结果 将 用 文件 filel 的 内 容 覆 盖 文 件 file2 的 原 有 内 
容 。 如 果 要 把 file4 的 内 容 附 加 到 文件 file2 的 末尾 , 则 应 使 用 另 一 个 输出 转向 符 “ 福 ”。 
例如 : 


$ cat file4 >> file2 
在 文件 file2 中 ,除了 上 次 复制 过 来 的 filel 的 内 容 外 ,后 面 又 附加 了 file4 的 内 容 。 当 然 , 若 
想 一 次 把 两 个 文件 filel 和 file4 全 部 复制 到 file2 中 , 则 可 用 以 下 命令 : 

$ cat filel file4 >> file2 

此 外 ,也 可 以 在 一 个 命令 行 中 同时 改变 输入 与 输出 。 例 如 

$a.out<filel > file0 


该 命令 表示 ,可 执行 文件 a. out 在 执行 时 将 从 文件 filel 中 提取 数据 ,而 把 执行 结果 数 
据 输出 到 文件 file0 中 。 


2. 管道 命令 


在 有 了 重 定向 思想 后 ,为 了 进一步 增强 功能 ,人们 又 进一步 把 这 种 思想 加 以 扩充 ,用 符 
号 “|”( 称 为 管道 线 ) 来 连接 两 条 命令 ,使 前 一 条 命令 的 输出 作为 后 一 条 命令 的 输入 , 称 为 管 
道 命令 ,其 用 法 如 下 : 

$ command1 | command 2 

例如 : 


$ cat file|WC 


命令 cat 把 文件 file 中 的 数据 作为 WC 命令 的 计数 输入 。 

系统 执行 上 述 输入 时 ,将 建立 一 个 作为 通信 通道 的 pipe 文件 。 这 时 ,cat 命令 的 输出 既 
不 出 现在 终端 (屏幕 ) 上 ,也 不 存 人 某 中 间 文 件 ,而 是 由 Linux 系统 临时 存储 第 一 条 命令 的 输 
出 ,并 将 其 作为 第 二 条 命令 的 输入 。 在 用 管道 线 连接 的 命令 之 间 实 现 单 向 .同步 运行 。 其 单 
向 性 表现 为 : 只 把 管道 线 前 面 的 命令 的 输出 送 入 管道 ,而 管道 的 输出 数据 仅 供 管道 线 后 面 
的 命令 读 取 。 管 道 的 同步 特性 则 表现 为 : 当 一 条 管道 满 时 ,其 前 一 条 命令 停止 执行 ; 而 当 
管道 空 时 , 则 其 后 一 条 命令 停止 运行 。 除 此 两 种 情况 外 ,用 管道 线 所 连接 的 两 条 命令 “同时 ” 
运行 。 可 见 ,利用 管道 功能 ,可 以 用 流水 线 方式 实现 命令 的 流水 线 化 , 即 在 单一 命令 行 中 同 
时 运行 多 条 命令 ,以 加 快 复杂 任务 的 完成 。 


2.2.5 通信 命令 
为 实现 源 用 户 与 目标 用 户 之 间 的 通信 ,可 以 由 系统 为 每 一 用 户 设置 一 个 信箱 , 源 用 户 把 
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信件 投入 到 目标 用 户 的 信箱 中 去 ; 目标 用 户 则 可 在 此 后 的 任 一 时 间 从 自己 的 信箱 中 读 取 信 
件 。 在 这 种 通信 方式 中 , 源 用 户 和 目标 用 户 之 间 进 行 的 是 非 交 互 式 通信 ,因而 也 是 非 实时 通 
信 。 但 在 有 些 办 公 自 动 化 系统 中 ,经 常 要 求 在 两 个 用 户 之 间 进 行 交互 式 会 话 , 即 源 用 户 与 目 
标 用 户 双方 必须 同时 联机 操作 。 在 源 用 户 发 出 信息 后 ,要 求 目标 用 户 能 立即 收 到 信息 并 给 
予 回答 。 

Linux 系统 为 用 户 提供 了 实时 和 非 实 时 两 种 通信 方式 ,分 别 用 write 及 mail 命令 。 此 
外 ,联机 用 户 还 可 根据 自己 的 当前 情况 决定 是 否 接受 其 他 用 户 与 他 进行 通信 的 要 求 。 


1. 信箱 通信 命令 mail 


mail 被 作为 在 Linux 的 各 用 户 之 间 进 行 非 交 互 式 通信 的 工具 。mail 采用 信箱 通信 方 
式 。 发 信者 把 要 发 送 的 信息 写成 信件 ,发送 到 对 方 的 信箱 中 。 通 常 各 用 户 的 私有 信箱 采用 
各 自 的 注册 名 命名 , 即 它 是 目录 /usr/spool/mail 中 的 一 个 文件 ,而 文件 名 又 是 用 接收 者 的 
注册 名 来 命名 的 。 信 箱 中 的 信件 可 以 一 直 保 留 到 被 信箱 所 有 者 删除 为 止 。 因 而 ,用 mail 进 
行 通信 时 ,不 要 求 接收 者 利用 终端 与 发 送 者 会 话 。 即 ,在 发 信者 发 送信 息 时 ,虽然 接收 者 已 
在 系统 中 注册 过 ,但 允许 他 此 时 没有 使 用 系统 ; 也 可 以 是 他 虽 在 使 用 系统 ,但 拒绝 接收 任何 

mail 命令 在 用 于 发 信 时 ,把 接收 者 的 注册 名 当 作 参数 输入 后 , 便 可 在 新 行 开 始 输 入 信 
件 正文 ,最 后 在 一 个 新 行 上 ,用 *. ”来 结束 信件 或 按 Ctrl 十 D 键 退出 mail 程序 (也 可 带 选 项 ， 
此 处 不 作 介绍 ) 。 

接收 者 也 用 mail 命令 读 取信 件 ,可 使 用 选项 r`.q 或 p 等 。 其 命令 格式 为 

mail [—r][ -ql[—p][ -file][—F persons] 

由 于 信箱 中 可 存放 接收 的 多 个 信件 ,这 就 存在 一 个 选取 信件 的 问题 。 选 项 r 表示 按 先 
进 先 出 顺序 显示 各 信件 的 内 容 ; 选项 q 表示 在 输入 中 断 字符 ( 按 Delete 或 回 车 键 ) 后 退出 
mail 程序 而 不 改变 信箱 的 内 容 ; 选项 p 表示 一 次 性 地 显示 信箱 全 部 内 容 而 不 带 询问 ,把 指 
定 文件 当 作 信 件 来 显示 。 在 不 使 用 p 选项 时 ,表示 在 显示 完 一 个 信件 后 便 出 现 *“?”, 以 询问 
用 户 是 否 继续 显示 下 一 条 消息 ,或 读 完 最 后 一 条 消息 后 退出 mail。 此 外 ,还 可 使 用 其 他 选 
项 以 指示 对 消息 的 各 种 处 理 方式 ,在 此 不 予 介 绍 。 


2. 对 话 通信 命令 write 


用 write 命令 可 以 使 用 户 与 当前 在 系统 中 的 其 他 用 户 直接 进行 联机 通信 。 由 于 Linux 
系统 允许 一 个 用 户 同时 在 几 个 终端 上 注册 , 故 在 用 此 命令 前 ,要 用 who 命令 查看 目标 用 户 
当前 是 否 联机 ,或 确定 接收 者 所 使 用 的 终端 名 。 命 令 格式 为 

$ write user[ ttyname] 

当 接 收 者 只 有 一 个 终端 时 ,终端 名 可 省 略 。 当 接收 者 的 终端 被 允许 接收 消息 时 ,屏幕 提 
示 会 通知 接收 者 源 用 户 名 及 其 所 用 终端 名 。 


3. 允许 或 拒绝 接收 消息 的 mesg 命令 











其 格式 为 : 
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mesg[—n][ 一 了 ] 


选项 n 表示 拒绝 对 方 的 写 许可 ( 即 拒绝 接收 消息 ); 选项 y 表示 恢复 对 方 的 写 许可 , 仅 
在 此 时 ,双方 才 可 联机 通信 。 当 用 户 正在 联机 编写 一 份 资料 而 不 愿 被 别人 干扰 时 , 常 选用 n 
选项 来 拒绝 对 方 的 写 许 可 。 编 辑 完毕 ,再 用 带 有 y 选项 的 mesg 命令 来 恢复 对 方 的 写 许可 ， 
不 带 任何 选 顶 的 mesg 命令 只 报告 当前 状态 而 不 改变 它 。 


2.2.6 后 台 命 令 


有 些 命令 需要 执行 很 长 的 时 间 ,这 样 , 当 用 户 输入 该 命令 后 , 便 会 发 现 自己 已 无 事 可 做 ， 
要 一 直 等 到 该 命令 执行 完毕 , 方 可 再 输入 下 一 条 命令 。 这 时 用 户 自 然 会 想到 应 该 利用 这 段 
时 间 去 做 些 别 的 事 。Linux 系统 提供 了 这 种 机 制 , 用 户 可 以 在 这 种 命令 后 面 加 上 人 ,以 告诉 
Shell 将 该 命令 放 在 后 台 执 行 ,以 便 用 户 在 前 台 继续 输入 其 他 命令 。 

在 后 台 运 行 的 程序 仍然 把 终端 作为 它 的 标准 输出 和 标准 输出 ,除非 对 它们 进行 重新 定 
向 。 若 Shell 未 重 定向 标准 输入 , 则 Shell 和 后 台 进 程 将 会 同时 从 终端 读 入 。 这 时 ,用 户 从 
终端 输入 的 字符 可 能 被 发 送 到 某 个 进程 ,并 不 能 预测 哪个 进程 将 得 到 该 字符 。 因 此 ,对 所 有 
在 后 台 运 行 的 命令 的 标准 输入 都 必须 加 以 重 定向 ,从 而 使 从 终端 输入 的 所 有 字符 都 被 送 到 
Shell 进程 。 用 户 可 使 用 ps、wait 及 kill 命令 了 解 和 控制 后 台 进 程 的 运行 。 


@.3 程序 接口 


程序 接口 用 于 在 程序 与 系统 资源 及 系统 服务 之 间 实 现 交互 作用 ,而 为 了 保证 系统 的 安 
全 性 ,系统 提供 了 若干 系统 调用 (system call) 来 实现 用 户 程序 和 内 核 的 交互 。 因 此 ,系统 调 
用 是 操作 系统 提供 给 编程 人 员 的 唯一 接口 。 编 程 人 员 利 用 系统 调用 ,在 源 程序 一 级 动态 请 
求 和 释放 系统 资源 ,调用 系统 中 已 有 的 系统 功能 来 完成 那些 与 计算 机 硬件 相关 的 工作 以 及 
控制 程序 的 执行 速度 等 。 事实 上 ,命令 控制 界面 也 是 在 系统 调用 的 基础 上 开发 而 成 的 。 


2.3.1 系统 调用 


通常 ,在 操作 系统 的 核心 中 都 设置 了 一 组 用 于 实现 各 种 系统 功能 的 子 程序 (过 程 ), 用 户 
可 以 在 程序 中 直接 或 间接 地 使 用 这 些 子 程序 ,这 些 子 程序 被 称 为 系统 调用 。 采 用 低级 语言 
编程 可 以 直接 使 用 这 些 子 程序 ; 采用 高 级 语言 编程 则 采用 程序 调用 的 方式 ,通过 解释 或 纺 
译 程序 将 其 翻译 成 有 关 的 系统 调用 ,完成 各 种 功能 和 服务 。 

系统 调用 是 用 户 程序 进入 内 核 程序 的 唯一 途径 ,因此 , 它 与 一 般 的 过 程 调用 有 下 述 儿 方 
面 的 明显 差别 : 

(1) 运行 在 不 同 的 系统 状态 。 一 般 的 过 程 调用 ,其 调用 程序 和 被 调用 程序 都 运行 在 相 
同 的 状态 一 一 系统 态 或 用 户 态 ; 而 系统 调用 与 一 般 调用 的 最 大 区 别 就 在 于 : 调用 过 程 运行 
在 用 户 态 , 而 被 调用 程序 (系统 调用 ) 运 行 在 系统 态 。 

(2) 通过 软 中 断 进入 。 由 于 一 般 的 过 程 调用 并 不 涉及 系统 状态 的 转换 , 故 可 直接 由 调 
用 程序 转向 被 调用 程序 。 但 在 运行 系统 调用 时 ,由 于 调用 程序 和 被 调用 程序 工作 在 不 同 的 
系统 状态 ,因而 不 允许 由 调用 程序 直接 转向 被 调用 程序 。 通 常 都 是 通过 软 中 断 机 制 , 先 由 用 
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户 态 转换 为 系统 态 ,经 核心 分 析 后 ,才能 转向 相应 的 系统 调用 处 理子 程序 。 

(3) 返回 问题 。 在 采用 了 抢占 式 ( 和 剥夺 ) 调 度 方式 的 系统 中 ,在 被 调用 程序 执行 完 后 ,要 
对 系统 中 所 有 要 求 运行 的 程序 做 优先 权 分 析 。 当 调用 程序 仍 具 有 最 高 优先 级 时 , 才 返回 到 
调用 程序 继续 执行 ; 否则 ,将 引起 重新 调度 ,以 便 让 位 优先 权 最 高 的 程序 优先 执行 。 此 时 ， 
将 把 调用 程序 放 入 就 绪 队 列 。 

(4) 幅 套 调用 。 像 一 般 过 程 调用 一 样 ,系统 调用 也 可 以 赃 套 进行 , 即 在 一 个 被 调用 程序 
的 执行 期 间 , 还 可 以 利用 系统 调用 命令 去 调用 另 一 个 系统 调用 。 但 是 ,每 个 系统 对 和 嵌 套 调用 
的 深度 都 有 一 定 的 限制 ,例如 最 大 深度 为 6。 

系统 调用 的 主要 目的 是 使 得 用 户 可 以 使 用 操作 系统 提供 的 有 关 设 备 管理 .输入 输出 系 
统 、 文 件 系统 、 进 程控 制 . 通 信 以 及 存储 管理 等 方面 的 功能 ,而 不 必 了 解 系统 程序 的 内 部 结构 
和 有 关 硬 件 细节 ,从 而 起 到 减轻 用 户 负担 和 保护 系统 以 及 提高 资源 利用 率 的 作用 。 


2.3.2 系统 调用 的 类 型 


系统 调用 大 致 可 分 为 如 下 几 类 ; 

(1) 设备 管理 。 该 类 系统 调用 用 来 请 求 和 释放 有 关 设备 以 及 启动 设备 操作 等 。 

(2) 文件 管理 。 包 括 对 文件 的 读 、 写 .创建 和 删除 等 。 

(3) 进程 控制 。 进 程 是 一 个 在 功能 上 独立 的 程序 的 一 次 执行 过 程 。 进 程控 制 的 有 关系 
统 调用 包括 进程 创建 .进程 执行 .进程 撤销 .进程 等 待 和 执行 优先 级 控制 等 。 

(4) 进程 通信 。 该 类 系统 调用 在 进程 之 间 传 递 消息 或 信号 。 

(5) 存储 管理 。 包 括 调查 进程 占据 内 存 区 的 大 小 、 获 取 进 程 占据 内 存 区 的 始 址 等 。 


2.3.3 系统 调用 的 实现 


系统 调用 的 实现 与 一 般 过 程 调用 的 实现 相 比 有 很 大 差异 。 对 于 系统 调用 ,控制 是 由 原 
来 的 用 户 态 转换 为 系统 态 , 这 是 借助 于 中 断 和 陷入 处 理 机 构 来 完成 的 ,在 该 机 构 中 包括 中 断 
和 陷入 硬件 机 构 及 中 断 与 陷入 处 理 程序 两 部 分 。 


1. 中 断 和 陷入 向 量 


为 了 处 理 上 的 方便 ,通常 都 是 针对 不 同 的 设备 编制 不 同 的 中 断 处 理 程序 ,并 把 该 程序 的 
人 入口 地 址 放 在 某 特 定 的 内 存单 元 中 。 此 外 ,不 同 的 设备 也 对 应 着 不 同 的 程序 状态 字 , 且 把 它 
放 在 与 中 断 处 理 程序 人 口 指针 相 邻 接 的 特定 单元 中 。 在 进行 中 断 处 理 时 ,只 要 有 了 这 样 两 
个 字 , 便 可 转 人 相应 设备 的 中 断 处 理 程 序 , 重 新 装配 处 理 机 的 状态 字 和 优先 级 ,对 该 设备 进 
行 处 理 。 因 此 我 们 把 这 两 个 字 称 为 中 断 向 量 。 相 应 地 ,把 存放 这 两 个 字 的 单元 称 为 中 断 向 
量 单 元 。 类 似 地 ,对 于 陷入 ,由 所 有 系统 调用 的 入 口 地 址 组 成 陷入 向 量 。 所 有 的 中 断 向 量 和 
陷入 向 量 一 起 构成 了 中 断 和 陷入 向 量 表 。 





2. 系统 调用 号 和 参数 的 设置 


往往 在 一 个 系统 中 设置 了 许多 个 系统 调用 ,并 赋予 每 个 系统 调用 一 个 唯一 的 系统 调用 
功能 号 ,例如 0、1、2、3 等 ,由 用 户 通 过 系统 调用 号 来 分 别 调用 相应 的 系统 功能 。 在 有 的 系统 
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中 ,直接 把 系统 调用 号 放 在 系统 调用 命令 中 。 例 如 ,IBM 370 和 早期 的 Linux 系统 把 系统 调 
用 命令 的 低 8 位 用 于 存放 系统 调用 号 ; 在 另 一 些 系统 中 , 则 将 系统 调用 号 装 和 人 指定 寄存 器 
或 内 存单 元 中 ,如 MS-DOS 是 将 系统 调用 号 放 在 AH 寄存 器 中 。 

由 于 不 同 的 系统 调用 需要 传递 给 系统 子 程序 以 不 同 的 参数 ,而 且 , 系 统 调用 的 执行 结果 
也 要 以 参数 的 形式 返回 给 用 户 程 序 。 因 此 ,在 执行 系统 调用 时 ,设置 系统 调用 所 需 的 参数 有 
两 种 方式 : 

(1) 直接 将 参数 送 入 相应 的 寄存 器 中 。 这 是 一 种 最 简单 的 方式 , MS-DOS 便 是 采用 的 
这 种 方式 , 即 用 MOV 指令 将 各 个 参数 送 入 相应 的 寄存 器 中 。 这 种 方式 的 主要 问题 是 : 由 
于 寄存 器 数量 有 限 ,因而 限制 了 所 设置 参数 的 数目 。 

(2) 参数 表 方式 。 将 系统 调用 所 需 的 参数 放 人 一 张 参数 表 中 ,再 将 指向 该 参数 表 的 指 
针 放 在 某 个 指定 的 寄存 器 中 。 当 前 大 多 数 的 操作 系统 ,如 Linux 系统 , 便 采 用 了 这 种 方式 。 
该 方式 可 进一步 分 为 直接 和 间接 两 种 方式 ,如 图 2-1 所 示 。 在 直接 参数 方式 中 ,所 有 的 参数 
值 和 参数 个 数 N 都 放 入 一 张 参数 表 中 ; 而 在 间接 参数 方式 中 , 则 在 参数 表 中 仅 存 放 参 数 个 
数 和 指向 真正 的 参数 表 的 指针 。 
































参数 表 参数 表 
N N | TrapX X 
参数 1 指针 参数 1 
参数 2 参数 2 
参数 n 参数 n 
(a) 直接 方式 (b) 间接 方式 


图 2-1 系统 调用 的 参数 表 方 式 


3. 系统 调用 的 处 理 步骤 


根据 编程 人 员 给 定 的 系统 调用 名 和 参数 ,系统 设置 了 系统 调用 号 和 传递 参数 后 , 便 可 执 
行 一 条 相应 的 系统 调用 指令 (这 条 指令 通常 称 为 陷 人 指令 )。 不 同 的 系统 可 采用 不 同 的 执行 
方式 ,在 Linux 系统 中 是 执行 CHMK 命令 ,而 在 MS-DOS 中 则 是 执行 INT 21 软 中 断 。 在 
处 理 机 执行 这 条 指令 时 发 生 相应 的 陷入 中 断 , 并 发 出 有 关 信 号 给 系统 中 的 中 断 和 陷入 处 理 
机 构 。 该 处 理 机 构 在 收 到 了 处 理 机 发 来 的 信号 后 ,启动 相关 的 处 理 程序 和 硬件 完成 该 系统 
调用 所 要 求 的 功能 。 

系统 调用 的 处 理 过 程 可 分 成 以 下 3 步 : 

(1) 保护 处 理 机 现场 。 首 先 ,在 系统 发 生 了 陷入 中 断 时 ,为 了 不 让 用 户 程序 直接 访问 系 
统 程序 ,反映 处 理 机 硬件 状态 的 处 理 机 状态 字 中 的 相应 位 要 从 用 户 执行 模式 (用 户 态 ) 转 换 
为 系统 执行 模式 (系统 态 ) ,这 一 转换 在 发 生 陷入 中 断 时 由 硬件 自动 实现 ; 然后 ,保护 被 中 断 
进程 的 CPU 环境 ,将 处 理 机 状态 字 、 程 序 计数 器 、 系 统 调用 号 、 用 户 栈 指针 以 及 通用 寄存 器 
内 容 等 压 人 堆栈 ; 最 后 ,将 用 户 定义 的 参数 传送 到 指定 的 地 方 保存 起 来 。 

(2) 取得 系统 调用 功能 号 并 转 人 相应 的 处 理 程序 。 为 使 不 同 的 系统 调用 能 方便 地 转向 
相应 的 系统 调用 处 理子 程序 ,在 系统 中 配置 了 一 张 系统 调用 人口 表 ( 陷 人 向 量 表 ), 表 中 的 每 
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个 表 目 都 对 应 一 条 系统 调用 ,其 中 包含 该 系统 调用 自 带 参数 的 数目 .系统 调用 子 程序 的 人 口 
地 址 等 。 因 此 ,核心 可 利用 系统 调用 号 去 查找 该 表 , 即 可 找到 相应 的 处 理子 程序 的 入口 地 址 
而 转 去 执行 相应 的 程序 。 

(3) 返回 。 由 于 用 户 程序 还 需 利 用 系统 调用 返回 的 结果 继续 执行 ,因此 ,在 系统 调用 处 
理 结束 之 后 , 陷 人 处 理 机 构 还 要 恢复 处 理 机 现场 。 系 统 调用 的 处 理 过 程 如 图 2-2 所 示 。 













































































用 户 程序 陷入 处 理 机 构 系统 子 程序 
Aol subo 
净 到 | | 0D 保护 处 理 全 

上 机 现场 多 Ai subi 

(2) 取 系统 调 

system call 用 功能 号 | ”| 
| 并 寻找 子 A = Ai| sub, 
| 程序 入 口 : 5 
G) 返回 A 
An| sub, 











图 2-2 系统 调用 处 理 过 程 


2.3.4 Linux 系统 调用 


Linux 内 核 中 设置 了 一 组 用 于 实现 系统 功能 的 子 程序 , 称 为 系统 调用 。 系 统 调 用 和 普 
通 库 函 数 调用 非常 相似 ,只 是 系统 调用 由 操作 系统 核心 提供 ,运行 于 核心 态 , 而 普通 的 函数 
调用 由 函数 库 或 用 户 自己 提供 ,运行 于 用 户 态 。 系 统 在 内 核 中 定义 了 一 个 系统 调用 入 口 地 
址 表 _sys_call_table, 该 表 记 录 了 所 有 已 注册 过 的 系统 调用 函数 , 表 中 为 每 一 个 系统 调用 指 
定 了 唯一 的 系统 调用 号 。 

Linux 通过 软 中 断 指令 int 0x80 来 陷入 核心 态 ( 在 Intel Pentium 开 又 引入 了 sysenter 
指令 ) 通 过 寄存 器 传递 参数 。 中 断 0x80 把 控制 权 传 给 核心 人 口 地 址 中 的 _system_call()， 
system_call() 将 所 有 的 寄存 器 内 容 压 入 用 户 栈 ,并 检查 系统 调用 是 否 合法 ,如 果 合 法 ,确定 
系统 调用 号 ,从 _sys_call_table 中 找 出 相应 的 系统 调用 入 口 地 址 ,执行 相应 的 系统 调用 
功能 。 

系统 调用 的 编程 接口 对 用 户 来 说 比较 复杂 ,Linux 系统 为 了 向 户 屏蔽 这 种 复杂 性 ,将 系 
统 调用 接口 默认 链接 到 所 有 用 户 程序 的 应 用 编程 接口 (API) 的 库 函 数 中 ,这 就 是 glibc 的 标 
准 C 库 函数 。 在 标准 C 库 函数 中 为 每 个 系统 调用 设置 了 一 个 封装 例 程 。 当 一 个 程序 需要 
一 个 系统 调用 时 ,就 可 调用 C 库 函 数 中 相应 的 封装 例 程 ,从 而 降低 了 用 户 程 序 设计 难度 , 节 
省 用 户 的 编程 时 间 。 

这 里 需要 特别 强调 的 是 ,并 非 所 有 的 标准 C 库 函 数 都 是 系统 调用 的 封装 例 程 。 或 者 
说 ,系统 调用 的 封装 例 程 只 是 这 个 C 函数 库 中 的 一 部 分 ,其 中 还 有 一 部 分 库 函 数 是 不 需要 
系统 调用 就 可 以 实现 的 , 像 一 些 抽象 的 数学 计算 库 函 数 , 应 用 编程 接口 提供 它们 也 是 为 了 方 
便 用 户 使 用 ,但 这 类 函数 不 需要 系统 内 核 代 码 来 实现 。 

随 着 Linux 系统 版 本 的 不 断 更 新 ,其 提供 的 系统 调用 也 不 断 增加 ,数量 已 增 至 数 百 条 ， 
其 中 最 常用 的 有 30 多 条 。 根 据 功能 的 不 同 ,Linux 的 系统 调用 大 致 可 分 为 如 下 6 类 。 
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1. 有 关 设 备 管理 的 系统 调用 


这 些 系统 调用 可 以 对 有 关 设 备 进行 读 写 和 控制 等 。 例 如 系统 调用 ioctl 为 所 有 设备 的 
专用 命令 提供 一 个 一 般 的 .通用 的 人 口 点 , 它 允 许 一 个 进程 预 置 与 一 个 设备 相 联系 的 硬件 选 
择 项 和 与 一 个 驱动 程序 相 联系 的 软件 选择 项 ,从 而 使 设备 和 相应 的 驱动 程序 连接 起 来 ; 系 
统 调 用 read、write 可 用 来 对 指定 设备 进行 读 写 ; 系统 调用 open 和 close 可 用 来 打开 和 关闭 
某 一 指定 设备 。 

















2. 有 关 文 件 系统 的 系统 调用 


有 关 文 件 系 统 的 系统 调用 是 用 户 经 常 使 用 而 且 种 类 较 多 的 一 类 。 它 包括 文件 的 打开 
(open) .关闭 (close) . 读 (read) 、 写 (write) ,创建 (create) 和 删除 (unlink) 等 调用 ,还 包括 文件 
的 执行 (execl) 、 控 制 (foctl) 、 加 锁 /解锁 (flock)、 文 件 状态 的 获取 (stat) 和 安装 文件 系统 
(mount) 等 。 较 常用 的 有 文件 的 打开 、 创 建 \ 读 、 写 和 关闭 等 。 


3. 有 关 进 程控 制 的 系统 调用 


关于 进程 控制 的 系统 调用 有 创建 进程 的 fork、 阻 塞 当前 执行 进程 自己 的 wait、 进 程 自 
我 终止 的 exit、 获 得 进程 标识 符 的 getpid、 获 取 父 进程 标识 的 getppid、 获 取 进 程 优先 级 的 
getpriority、 改 变 进程 优先 级 的 nice、 发 送 和 接收 信号 的 kill 和 signal、 和 暂停 当前 进程 执行 过 
程 的 pause 以 及 进行 管道 通信 的 pipe 等 。 

创建 进程 的 系统 调用 fork 的 使 用 格式 是 n= 二 fork(); 该 系统 调用 的 返回 值 可 以 是 0、 大 
于 0 的 整数 或 一 1。n=0 时 表示 系统 将 执行 子 进程 的 有 关 程 序 段 ,n>0 时 表示 系统 将 执行 
父 进程 的 程序 段 ,而 n 二 一 1 则 表示 子 进 程 未 创建 成 功 。 无 论 n= 二 0 还 是 n 二 0, 父 进程 的 程 
序 段 和 子 进程 的 程序 段 都 将 得 到 执行 ,只 是 二 者 执行 的 时 间 和 顺序 有 差别 。 

系统 调用 wait 的 返回 值 是 等 待 子 进程 的 进程 标识 符 。wait 的 功能 是 阻塞 父 进程 ,等待 
子 进程 完成 后 使 得 父 进程 继续 工作 。 

系统 调用 exit 终止 调用 进程 本 身 ,并 释放 其 所 占用 的 所 有 资源 。 

管道 通信 用 的 系统 调用 pipe(fd) 为 同一 家 族 的 进程 之 间 传 递 数 据 建 立 一 条 管道 。 其 中 
参数 fd 是 一 个 包含 两 个 单元 的 整 型 数组 ,fd[0] 代 表 管 道 的 读 端 ,而 fdL1] 代 表 管 道 的 写 端 。 
管道 被 创建 之 后 ,一般 和 系统 调用 read、write 联合 使 用 ,有 关 管 道 通信 ,将 在 3. 6. 2 节 中 进 
一 步 说 明 。 

除了 上 述 系 统 调用 之 外 ,在 进程 控制 中 还 经 常用 到 两 个 有 用 的 实用 程序 。 一 个 是 sleep 
(n) ,执行 该 实用 程序 使 得 当前 执行 进程 睡眠 指定 秒 数 。 另 一 个 是 用 于 进程 互 斥 的 实用 程 
序 lockf(fd,mode, size) ,其 功能 是 将 指定 文件 fd 的 指定 区 域 进行 加 锁 或 解锁 ,以 解决 临界 
资源 文件 的 竞争 问题 。 


4. 有 关 进 程 通信 的 系统 调用 


进程 通信 用 的 系统 调用 主要 包括 套 接 字 (socket) 的 建立 链接 .控制 和 删除 ,进程 间 通 
信用 的 消息 队列 ` 共 用 存储 区 ,以 及 有 关 同 步 机 制 的 建立 .链接 .控制 和 删除 等 。 
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5. 关于 存储 管理 的 系统 调用 


这 些 系统 调用 包括 获取 内 存 现 有 空间 大 小 、 检 查 内 存 中 现 有 进程 ,对 内 存 区 进行 保护 和 
改变 堆栈 大 小 等 功能 。 


6. 管理 用 系统 调用 


管理 用 系统 调用 包括 设置 和 读 取 日 期 和 时 间 、 用 户 和 主机 等 的 标识 符 等 系统 调用 。 
一 个 系统 提供 的 系统 调用 越 多 ,系统 的 功能 就 越 强 ,用 户 使 用 起 来 也 就 越 方 便 灵活 。 
下 面 是 一 个 使 用 目录 系统 调用 的 例子 ,实现 了 Linux 命令 pwd 的 功能 。 

例 2-1 利用 系统 调用 getcwd(char * buf,size_t size) 实 现 Linux 命令 pwd 的 功能 。 








# include < stdio. h> 
#include < stdlib.h> 
#include <unistd.h> 
#define MAX PATH 255 
int main() 
{ 
char name[ MAX_PATH+ 1]; 
if(getcwd(name, MAX_PATH) == NU11) 
printf("error:Failure getting pathname" ); 
printf("Current Directory: % S\n", name); 
} 
程序 的 运行 结果 : 


Current Directory: /home/student 


以 上 代码 调用 了 glibc 封装 的 系统 调用 函数 。 如 果 glibc 没有 封装 某 个 内 核 提 供 的 系统 
调用 时 ,就 不 能 通过 上 面 的 方法 来 调用 该 系统 调用 。 例 如 用 户 通过 编译 内 核 增加 了 一 个 系 
统 调用 ,glibc 不 可 能 有 用 户 新 增 的 系统 调用 的 封装 API, 此 时 可 以 利用 glibc 提供 的 syscall 
函数 直接 调用 新 增 的 系统 调用 。 该 函数 定义 在 unistd. h 头 文件 中 ,函数 原型 如 下 : 


long int syscall (long int sysno, …) 


其 中 ,sysno 是 系统 调用 号 ,每 个 系统 调用 都 用 唯一 的 系统 调用 号 来 标识 。 在 sys/syscall. h 
中 有 所 有 可 能 的 系统 调用 号 的 宏 定义 ;“…” 表 示 剩 余 可 变 长 的 参数 ,为 系统 调用 所 带 的 参 
数 , 根 据 系统 调用 的 不 同 , 可 带 0 一 5 个 参数 ,如 果 超过 特定 系统 调用 能 带 的 参数 个 数 , 多 余 
的 参数 被 忽略 。 

由 上 可 见 ,一 个 用 户 程 序 将 频繁 地 利用 各 种 系统 调用 以 取得 操作 系统 所 提供 的 多 种 
服务 。 


2.3.5 Windows 应 用 编程 接口 


Windows 程序 采用 事件 驱动 方式 。 即 ,应 用 程序 根据 事件 的 内 容 , 如 鼠标 的 一 个 点 击 、 
移动 .键盘 的 按键 按 下 等 操作 ,都 是 对 应 操作 系统 的 一 个 事件 ,然后 调用 相应 的 程序 进行 
处 理 。 当 应 用 程序 调用 操作 系统 服务 时 ,由 硬件 产生 一 个 陷入 信号 ,将 应 用 程序 从 用 户 态 切 


44 


vt 


操作 系统 原理 及 Li nux 内 核 分 析 (第 2 版 ) 


换 到 核心 态 , 将 控制 权 转交 给 陷入 处 理 程序 ,查找 系统 服务 调度 表 , 即 陷入 向 量 表 , 找 到 对 应 
的 系统 服务 程序 入 口 地 址 ,执行 相应 的 系统 服务 程序 。 

为 了 进一步 促进 操作 系统 和 应 用 软件 之 间 的 互通 ,方便 用 户 编写 Windows 应 用 程序 ， 
Windows 提供 了 大 量 的 子 程序 和 函数 ,也 就 是 Windows 应 用 编程 接口 (API) 。 一 个 API 
函数 可 能 不 与 任何 系统 调用 相对 应 ,也 可 能 调用 一 个 或 多 个 系统 调用 ,不 同 的 API 可 能 封 
装 了 相同 的 系统 调用 。API 是 一 种 公共 的 、 标 准 的 应 用 接口 ,使 不 同 的 软件 系统 可 以 互相 利 
用 ,共享 信息 。 

标准 Windows API 函数 可 分 为 以 下 7 类 。 


1. 系统 服务 


系统 服务 函数 为 应 用 程序 提供 了 访问 计算 机 资源 与 底层 操作 系统 特性 的 手段 ,包括 内 
存 管理 ,文件 系统 .设备 管理 .进程 和 线程 控制 等 。 应 用 程序 使 用 系统 服务 函数 来 管理 和 监 
视 它 所 需要 的 资源 。 


2. 通用 控件 库 


系统 提供 了 通用 控件 库 , 属 于 操作 系统 的 一 部 分 ,所 以 它们 对 所 有 的 应 用 程序 都 可 用 。 
使 用 通用 控件 库 有 助 于 使 应 用 程序 的 用 户 界面 与 其 他 应 用 程序 保持 一 致 ,同时 直接 使 用 通 
用 控件 也 可 以 节省 开发 时 间 。 

3. 图 形 设 备 接口 

图 形 设 备 接口 (Graphics Device Interface,GDT) 提 供 了 一 系列 的 函数 和 相关 的 结构 ,可 
以 绘制 直线 .曲线 .闭合 图 形 .文本 以 及 位 图 图 像 等 ,应 用 程序 可 以 使 用 它们 在 显示 器 .打印 
机 或 其 他 设备 上 生成 图 形 化 的 输出 结果 。 


4. 网 络 服务 


网 络 服务 函数 可 以 使 网 络 上 不 同 计 算 机 的 应 用 程序 之 间 进行 通信 ,可 以 创建 和 管理 网 
络 连 接 , 从 而 实现 资源 共享 ,例如 共享 网 络 打印 机 。 


5. 用 户 接口 


用 户 接口 函数 为 应 用 程序 提供 了 创建 和 管理 用 户 界面 的 方法 ,可 以 使 用 这 些 函 数 创建 
和 使 用 窗口 来 显示 输出 、 提 示 用 户 进行 输入 以 及 完成 其 他 一 些 与 用 户 进行 交互 所 需 的 工作 。 
大 多 数 应 用 程序 都 至 少 要 创建 一 个 窗口 。 














6. 系统 Shell 


Windows API 中 包含 一 些 接口 和 函数 ,应 用 程序 可 使 用 它们 来 增强 系统 Shell 各 方面 
的 功能 。 


7. 系统 信息 
系统 信息 函数 使 应 用 程序 能 够 确定 计算 机 与 桌面 的 有 关 信 息 , 例 如 确定 是 否 安装 了 鼠 
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标 、 显 示 屏 幕 的 工作 模式 等 。 
例 2-2 下 面 的 程序 应 用 Windows API 函数 实现 了 例 2-1 的 功能 。 


include "stdafx. h" 

include "windows. h" 

define DIRNAME LEN MAX PATH+2 

int WINAPI WinMain(HINSTANCE hInstance, 
HINSTANCE  hPrevInstance, 
LPSTR lpCmdLine, 
int nCmdShow) 


TCHAR PwdBuffer[ DIRNAME LEN]; 
DWORD LenCuDir; 
LenCuDir = GetCurrentDirectory(DIRNAME LEN,PwdBuffer); 
if(LenCuDir == 0) 

MessageBox( NULL, "Failure getting pathname, ", NULL, MB_OK); 
MessageBox( NULL, PwdBuffer, "Current Directory", MB_OK); 
return 0; 


} 


由 此 可 见 ,Windows API 也 是 一 个 基于 C 语言 的 接口 ,只 是 调用 函数 和 编程 模式 与 
Linux 不 同 。Windows API 中 的 函数 也 可 以 被 使 用 不 同 语言 编写 的 程序 调用 ,只 要 在 调用 
时 遵循 调用 规范 即 可 。 





习题 


1. 操作 系统 为 用 户 提供 了 哪 两 类 接口 ? 分 别 适 用 于 什么 情况 ? 
2. 通常 操作 系统 为 用 户 提供 的 命令 有 哪 几 类 ? 

3. 操作 系统 提供 的 联机 命令 接口 有 哪些 常用 的 操作 方式 ? 

4. Linux 系统 中 标准 输入 文件 和 标准 输出 文件 分 别 对 应 的 是 什么 ? 
5. 一 般 的 过 程 调用 与 系统 调用 有 什么 不 同 ? 

6. 系统 调用 有 哪儿 种 类 型 ? 

7. 说 明 系统 调用 的 处 理 步骤 。 

8. Linux 系统 调用 有 哪儿 类 ? 

9 


. 什么 是 API? 标准 Windows API 函数 可 以 分 为 哪 几 类 ? 

10. 举例 说 明 API 的 应 用 。 

11. 在 Linux 系统 中 ,练习 使 用 Shell 的 基本 命令 ,如 ls、pwd、cp、mv、rm、mkdir、cat、 
chmod、man 等 。 


12. 在 Linux 系统 中 ,常用 的 系统 调用 有 哪些 ? 





进程 管理 | 


处 理 机 是 系统 的 重要 资源 之 一 ,而 处 理 机 的 管理 实际 上 是 进程 的 管理 。 在 现代 计算 机 
系统 中 ,通常 以 进程 的 观点 来 设计 和 研究 操作 系统 。 因 此 ,只 有 深刻 理解 进程 的 概念 ,才能 
够 很 好 地 理解 操作 系统 各 部 分 的 功能 和 工作 原理 。 

本 章 首先 引入 进程 的 概念 ,指出 其 特点 ,然后 逐步 介绍 进程 的 管理 ,包括 进程 的 建立 、 调 
度 .控制 等 。 


6.i 进程 的 概念 


进程 是 现代 操作 系统 最 重要 的 概念 之 一 。 在 多 道 程序 系统 中 程序 并 发 执行 导致 其 出 现 
了 一 些 与 单 道 程序 顺序 执行 时 不 同 的 特征 ,由 此 引入 了 进程 的 概念 。 


3.1.1 进程 的 引入 
1. 单 道 程序 的 顺序 执行 


在 早期 的 计算 机 系统 中 ,只 有 单 道 程序 执行 的 功能 。 也 就 是 说 ,每 一 次 只 允许 一 道 程序 
运行 ,这 个 程序 在 运行 期 间 将 独占 整个 计算 机 系统 的 资源 ,而 且 系 统 按照 程序 的 步骤 顺序 地 
执行 ,在 该 程序 执行 完 之 前 ,其 他 程序 只 能 等 待 。 这 种 程序 执行 方式 称 为 顺序 执行 方式 。 程 
序 的 顺序 执行 具有 如 下 特点 : 

(1) 顺序 性 。 程 序 的 执行 过 程 是 一 系列 严格 按 程 序 规定 的 状态 转移 的 过 程 。 上 一 条 指 
令 的 执行 结果 是 下 一 条 指令 的 执行 开始 的 充分 必要 条 件 。 

(2) 封闭 性 。 程 序 是 在 封闭 的 环境 下 执行 的 。 即 程序 执行 时 独占 资源 ,资源 的 状态 ( 除 
初始 状态 外 ) 只 有 本 程序 才能 改变 。 程 序 执行 得 到 的 最 终结 果 由 初始 条 件 决定 ,不 受 外 界 因 
素 的 影响 。 

(3) 可 再 现 性 。 程 序 执行 结果 与 它 的 执行 速度 无 关 。 只 要 输入 的 条 件 相 同 ,重复 执行 
时 ,不 论 它 是 从 头 到 尾 不 停顿 地 执行 ,还 是 “ 停 停 走 走 " 地 执行 ,都 会 得 到 相同 的 结果 。 

程序 的 顺序 执行 的 特点 使 系统 管理 非常 方便 ,程序 员 检验 和 校正 程序 的 错误 也 很 容易 。 
然而 ,系统 的 资源 利用 率 却 非常 低 , 尤 其 在 对 外 部 设备 进行 操作 的 时 间 内 ,系统 处 理 器 都 在 


2. 多 道 程序 系统 中 程序 的 执行 


为 提高 处 理 机 的 效率 ,人 们 设想 让 多 个 程序 同时 执行 。 然 而 , 单 处 理 机 系统 每 一 时 刻 只 
能 执行 一 条 指令 。 如 果 要 同时 执行 多 条 指令 ,必须 具有 多 个 处 理 机 或 者 处 理 部 件 ,这 就 是 并 
行 结 构 和 并 行 处 理 要 解决 的 问题 。 

能 否 在 单 处 理 机 上 实现 程序 的 同时 执行 呢 ? 这 就 是 程序 的 并 发 执行 问题 。 并 发 执行 是 
基于 多 道 程序 的 一 个 概念 , 即 让 多 道 程序 在 计算 机 中 交替 地 执行 , 当 一 道 程序 不 用 处 理 机 
时 , 另 一 道 程序 就 马上 使 用 处 理 机 ,从 而 大 大 提高 了 处 理 机 的 利用 率 。 虽 然 在 每 一 时 刻 仍然 
只 有 一 条 指令 在 执行 ,但 在 计算 机 的 主 存储 器 中 同时 存放 了 多 道 程序 ,在 同一 时 间 间 隔 内 ， 
这 些 程序 在 交替 地 执行 。 因 此 ,在 微观 上 指令 是 顺序 执行 的 ,而 在 宏观 上 程序 是 并 发 执行 
的 ,从 而 减少 了 处 理 机 的 等 待 时 间 ,使 得 处 理 机 和 外 设 可 同时 工作 ,提高 了 系统 的 使 用 效率 。 

程序 的 并 发 执行 虽然 提高 了 系统 的 使 用 效率 ,但 由 于 多 道 程序 在 主机 中 并 发 执行 ,共享 
系统 资源 ,因而 产生 了 一 些 与 顺序 程序 不 同 的 特点 : 

(1) 间断 性 。 程 序 在 并 发 执行 时 ,由 于 它们 共享 系统 资源 ,并 且 为 完成 同一 项 任务 而 相 
互 合作 ,致使 在 这 些 并 发 执行 的 程序 之 间 形 成 了 相互 制约 的 关系 。 例 如 , 几 个 并 发 程序 竞争 
同一 资源 (如 打印 机 ) ,得 到 资源 的 程序 继续 运行 ,而 其 他 的 程序 则 只 有 等 待 ,这 是 间接 制约 。 
又 如 ,一 个 程序 请 求 从 磁盘 中 读 入 一 个 文件 , 它 就 直接 受到 系统 磁盘 管理 程序 何 时 完成 该 请 
求 的 制约 ,只 有 等 到 后 者 读 入 了 指定 的 文件 后 ,该 程序 才能 继续 执行 与 该 文件 有 关 的 操作 ， 
这 是 直接 制约 。 由 于 存在 制约 ,就 存在 等 待 。 因 此 ,并 发 程序 具有 “执行 一 暂停 一 执行 ”这 种 
间断 性 的 活动 规律 。 

(2) 失去 封闭 性 。 程 序 在 并 发 执行 时 ,多 个 程序 共享 系统 中 的 各 种 资源 ,因而 这 些 资 源 
的 状态 将 由 多 个 程序 来 改变 ,致使 程序 的 运行 失去 封闭 性 。 这 样 , 某 个 程序 在 执行 时 必然 会 
受到 其 他 程序 的 影响 。 例 如 , 当 处 理 机 这 一 资源 已 被 某 个 程序 占用 时 , 另 一 程序 必须 等 待 。 

(3) 不 可 再 现 性 。 程 序 在 并 发 执行 时 ,由 于 失去 了 封闭 性 ,也 将 导致 其 失去 可 再 现 性 。 

例 3-1 设 有 两 道 程序 CP 和 PP, 它们 共享 一 个 变量 n, 其 初 值 为 0。CP 程序 循环 
10 000 次 ,执行 n= 二 n 十 1; PP 程序 打印 n 的 值 。CP 和 PP 可 分 别 描述 如 下 : 





CP() PP() 
while(n<10000) printf("n= % d\n",n); 
n=nt+1; 并 

显然 ,如 果 上 例 中 的 CP 和 PP 程序 顺序 执行 ,其 执行 结果 为 n 王 10000( 屏 幕 显 示 )。 但 
如 果 让 两 个 程序 段 并 发 执行 ,程序 CP 和 PP 的 执行 速度 不 同 ,将 有 可 能 出 现下 述 几 种 情况 : 

(1) 首先 程序 CP 抢占 了 处 理 机 开始 执行 ,然后 执行 程序 PP ,执行 结 果 是 n 一 10000。 

(2) 首先 程序 PP 抢占 了 处 理 机 开始 执行 ,然后 执行 程序 段 CP, 执 行 结 果 是 n 一 0。 

(3) 如 果 在 某 一 分 时 系统 中 ,首先 程序 CP 开始 执行 ,执行 到 某 一 时 间 , 其 时 间 片 用 完 
(假设 CP 执行 到 n 二 2000) ,这 时 程序 PP 也 开始 执行 且 抢 占 了 处 理 机 ,执行 结果 为 n 一 2000 
和 n 一 10000。 

(4) 如 果 将 两 个 程序 放 在 另 一 个 执行 速度 较 快 的 分 时 系统 中 执行 ,假设 CP 执行 到 n= 
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3000 时 ,其 时 间 片 用 完 , 这 时 程序 PP 开始 执行 ,其 执行 结果 为 n 一 3000 和 n 二 10000。 

这 说 明 ,程序 在 并 发 执行 时 ,有 一 些 程序 经 过 多 次 执行 ,虽然 它们 执行 的 初始 条 件 相同 ， 
但 其 执行 速度 不 同 ,结果 也 不 同 。 即 ,在 多 道 程序 系统 中 ,程序 的 执行 不 再 具有 可 再 现 性 ,其 
至 会 出 现 错误 的 结果 。 


3. 进程 概念 的 引入 


从 上 述 讨论 可 以 看 出 ,在 多 道 程序 环境 下 ,程序 并 发 执行 ,程序 的 执行 具有 了 许多 新 的 
特性 ,程序 与 执行 结果 不 再 一 一 对 应 。 在 多 道 程序 系统 中 ,一 般 情况 下 ,并 发 执行 的 各 程序 
如 果 共 享 软 硬 件 资源 ,都 会 造成 其 执行 结果 受 执行 速度 影响 的 局 面 ( 例 3-1 中 的 程序 并 发 执 
行 出 现 不 同 的 结果 是 由 于 两 个 程序 共享 变量 n)。 显 然 , 这 是 程序 设计 人 员 不 希望 看 到 的 。 
为 了 在 并 发 执行 时 不 出 现 错误 结果 ,必须 采取 某 些 措施 来 制约 、 控 制 各 并 发 程序 的 执行 速 
度 , 这 在 操作 系统 程序 设计 中 尤为 重要 。 

为 了 控制 和 协调 各 程序 执行 过 程 中 对 软 硬 件 资源 的 共享 和 竞争 ,在 操作 系统 中 引入 了 
进程 的 概念 来 反映 和 刻画 系统 和 用 户 程序 的 活动 。 


3.1.2 进程 的 定义 
1. 进程 的 定义 


进程 的 概念 是 20 世纪 60 年 代 初期 首先 在 MIT 的 Mulitics 系统 和 IBM 的 TSS/360 系 
统 中 引入 的 。 此 后 ,人 们 对 进程 下 过 各 式 各 样 的 定义 。 现 列举 其 中 几 种 : 

(1) 进程 是 可 以 并 行 执行 的 计算 部 分 (S. E. Madnick,J.T. Donovan) 。 

(2) 进程 是 一 个 独立 的 可 以 调度 的 活动 (E. Cohen,Jonfferson) 。 

(3) 进程 是 一 个 抽象 实体 , 当 它 执行 某 个 任务 时 ,将 要 分 配 和 释放 各 种 资源 (P. Denning) 。 

(4) 行为 的 规则 叫 程序 ,程序 在 处 理 机 上 执行 的 活动 称 为 进程 (E. W. Dijkstra) 。 

(5) 一 个 进程 是 一 系列 逐一 执行 的 操作 ,而 操作 的 确切 含义 则 有 赖 于 以 何 种 详尽 程度 
来 描述 进程 (Brinch Hansen) 。 

以 上 对 进程 的 定义 尽管 各 有 侧重 ,但 本 质 是 相同 的 , 即 主要 注重 进程 是 一 个 程序 的 执行 
过 程 这 一 概念 。 进 程 是 程序 的 一 次 运行 活动 , 即 程序 是 一 种 静态 的 概念 ; 而 进程 是 一 种 动 
态 的 概念 , 它 是 “活动 的 ”。 

进程 和 程序 之 间 的 区 别 是 很 微妙 的 , 却 非常 重要 。 通 过 一 个 类 比 可 以 使 我 们 更 容易 理 
解 这 一 点 。 想 象 一 位 有 一 手 好 厨 艺 的 计算 机 科学 家 正在 为 他 的 女儿 烘 制 生 日 蛋糕 。 他 有 做 
生日 蛋糕 的 食谱 ,厨房 里 有 所 需 的 原料 : 面粉 ,鸡蛋 、 糖 、 香 草 汁 等 。 在 这 个 类 比 中 ,做 蛋糕 
的 食谱 就 是 程序 ( 即 用 适当 形式 描述 的 算法 ) ,计算 机 科学 家 就 是 处 理 机 (CPU) ,而 做 蛋糕 
的 各 种 原料 就 是 输入 的 数据 。 进 程 就 是 厨师 阅读 食谱 、 取 来 各 种 原料 以 及 烘 制 蛋 糕 的 一 系 
列 动作 的 总 和 。 

现在 假设 计算 机 科学 家 的 女儿 句 着 跑 了 进来 ,说 她 被 一 只 蜜蜂 整 了 。 计 算 机 科学 家 就 
记录 下 自己 照 着 食谱 做 到 哪儿 了 (保存 进程 的 当前 状态 ) ,然后 拿 出 一 本 急救 手册 ,按照 其 中 
的 指示 处 理 整 伤 。 这 里 ,我 们 看 到 处 理 机 从 一 个 进程 (做 蛋糕 ) 切 换 到 另 一 个 高 优先 级 的 进 
程 (实施 医疗 救治 ) ,每 个 进程 拥有 各 自 的 程序 (食谱 和 急救 指示 )。 当 蜜蜂 掉 伤 处 理 完 之 后 ， 


计算 机 科学 家 又 回来 做 蛋糕 ,从 他 离开 时 的 那 一 步 继续 做 下 去 (继续 执行 做 蛋糕 程序 ) 。 

这 里 的 关键 思想 是 : 一 个 进程 是 某 种 类 型 的 一 个 活动 , 它 有 程序 `. 输 入 、 输 出 及 状态 。 
单个 处 理 机 被 若干 进程 共享 , 它 使 用 某 种 调度 算法 决定 何 时 停止 一 个 进程 的 工作 ,并 转 而 为 
另 一 个 进程 提供 服务 。 

在 此 给 出 进程 的 定义 : 进程 是 一 个 具有 独立 功能 的 程序 对 某 个 数据 集 在 处 理 机 上 的 执 
行 过 程 和 分 配 资源 的 基本 单位 。 


2. 进程 的 特征 


在 操作 系统 中 ,进程 是 进行 系统 资源 分 配 、 调 度 和 管理 的 最 小 独立 单位 ,操作 系统 的 各 
种 活动 都 与 进程 有 关 。 为 了 进一步 明确 进程 的 概念 ,下 面 给 出 进程 的 一 些 突出 特征 。 

1) 动态 性 

动态 性 是 进程 最 基本 的 特征 之 一 。 进 程 是 程序 的 一 次 运行 过 程 ,具有 一 个 从 静止 到 活 
动 的 过 程 , 即 诞生 、 运 行 、 消 失 的 过 程 ,有 一 定 的 生命 周期 , 它 与 程序 并 不 一 一 对 应 。 程 序 是 
静态 的 ,只 是 指令 的 集合 ,作为 一 种 文件 可 长 期 存放 在 存储 装置 中 。 一 个 进程 可 以 对 应 一 个 
程序 ,或 者 对 应 一 段 程序 (一 个 程序 的 部 分 ); 一 个 程序 可 以 对 应 一 个 进程 ,也 可 以 对 应 多 个 
进程 ,此 时 称 这 个 程序 被 多 个 进程 所 共享 ,可 共享 的 程序 代码 被 称 为 可 重 入 代码 或 者 纯 代 
码 , 纯 代码 在 运行 过 程 中 不 能 被 改变 。 

2) 并 发 性 

并 发 性 是 指 多 个 进程 同时 驻 留 内 存 , 且 能 在 一 段 时 间 内 交替 和 运行。 并 发 性 是 进程 最 基 
本 的 特征 之 一 ,同时 也 是 操作 系统 的 重要 特征 。 引 入 进程 的 目的 也 正 是 为 了 使 多 个 进程 能 
并 发 运行 ,而 程序 是 不 能 并 发 运行 的 。 

3) 独立 性 

进程 是 操作 系统 中 可 以 独立 运行 的 基本 单位 ,也 是 分 配 资 源 和 进行 调度 的 基本 单位 。 
进程 在 获得 其 必需 的 资源 后 即 可 运行 ,在 不 能 得 到 某 个 资源 时 便 停止 运行 。 在 具有 并 发 性 
的 系统 中 ,未 建立 进程 的 程序 不 能 作为 一 个 独立 单位 运行 。 

4) 异步 性 

异步 性 指 进程 的 执行 起 始 时 间 的 随机 性 和 执行 速度 的 独立 性 。 

5) 结构 性 

为 了 记录 描述 .跟踪 和 控制 进程 的 变化 过 程 , 系 统 建立 了 一 套 重要 的 数据 结构 ,每 个 进 
程 有 其 对 应 的 数据 结构 。 


3.1.3 引入 进程 的 利 次 


引入 进程 是 多 道 程序 和 分 时 系统 的 需要 ,也 是 描述 程序 并 发 执行 活动 的 需要 。 在 操作 
系统 中 ,通过 为 每 道 程序 建立 进程 ,使 它们 彼此 间 能 够 并 发 执行 ,从 而 改善 系统 资源 的 利用 
率 , 提 高 系统 的 吞吐 量 。 因 此 ,目前 几乎 所 有 的 操作 系统 中 都 引入 了 进程 的 概念 ,支持 多 进 
程 的 操作 。 然 而 ,引入 进程 也 带 来 如 下 的 问题 。 

1) 空间 开销 

系统 必须 为 每 个 进程 建立 必需 的 数据 结构 和 管理 数据 结构 的 机 构 , 它 们 将 占据 一 定 的 
存储 器 空间 。 在 内 存 容量 较 小 的 情况 下 ,与 进程 有 关 的 空间 开销 成 为 一 个 包 裕 ,会 影响 内 存 
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空间 使 用 率 。 如 果 内 存 空间 足够 大 ,空间 影响 就 会 降低 。 

2) 时 间 开 销 

系统 为 了 管理 和 协调 进程 的 运行 ,要 不 断 跟踪 进程 的 运行 过 程 ,不 断 更 新 有 关 的 系统 和 
进程 数据 结构 ,进行 进程 间 的 运行 工作 切换 、 现 场 保护 等 。 这 些 都 需要 占用 处 理 机 的 时 间 ， 
使 系统 付出 时 间 开 销 。 时 间 开 销 与 操作 系统 设计 ` 数 据 结构 的 选择 以 及 高 速 处 理 机 的 采用 
都 有 直接 关系 。 


@.2 进程 控制 块 和 进程 的 状态 


由 前 面 的 叙述 可 知 ,进程 在 执行 过 程 中 ,具有 ”执行 一 暂停 一 执行 > 这 种 间断 性 的 活动 规 
律 。 需 要 有 一 个 专门 的 机 制 能 够 管理 进程 的 这 种 变化 过 程 。 


3.2.1 进程 的 状态 及 其 变化 


由 于 各 进程 在 其 生命 周期 内 的 并 发 执行 及 相互 制约 ,使 得 它们 的 状态 不 断 发 生变 化 。 
一 般 而 言 ,进程 具有 以 下 3 种 最 基本 的 状态 。 

(1) 就 绪 状 态 。 当 进程 已 分 配 到 除 处 理 机 以 外 的 所 有 必要 资源 后 ,只 要 再 获得 处 理 机 ， 
便 可 立即 执行 ,进程 这 时 的 状态 称 为 就 绪 状 态 。 

(2) 运行 状态 。 已 经 获得 处 理 机 及 其 他 的 运行 资源 ,正在 处 理 机 上 运行 的 进程 处 于 运 
行 状态 。 

(3) 等 待 状态 。 正 在 执行 的 进程 由 于 某 种 运行 条 件 不 具备 而 暂停 执行 时 ,在 等 待 某 一 
事件 的 发 生 , 此 时 进程 处 于 等 待 状态 ,有 时 也 称 为 阻塞 状态 。 致 使 进程 等 待 的 典型 事件 有 请 
求 WO、 申请 缓冲 空间 等 。 

在 单 处 理 机 系统 中 ,处 于 运行 状态 的 进程 只 有 一 个 。 正 在 运行 的 进程 如 果 因 分 配给 它 
的 时 间 片 到 而 被 暂停 运行 时 ,该 进程 便 由 运行 状态 又 回 到 就 绪 状 态 ; 处 于 就 绪 状 态 的 进程 


可 以 有 多 个 ,它们 都 具备 了 运行 的 所 有 条 件 ,仅仅 未 
获得 处 理 机 控制 权 , 如 果 有 多 个 处 理 机 ,这 些 就 绪 进 

程 都 可 以 转 入 运行 状态 。 如 果 需 要 等 待 某 一 事件 的 。 调度 村 
发 生 而 使 运行 受阻 (例如 ,进程 请 求 访问 某 种 独 享 次 四 yh 


源 , 而 该 资源 正在 被 其 他 进程 占用 ,必须 等 到 该 资源 
被 释放 ) ,该 进程 将 由 运行 状态 转变 为 等 待 状态 。 当 Cn (Gn) 
引起 阻塞 的 原因 解除 后 , 即 回 到 就 绪 状 态 。 图 3-1 给 AR 


出 了 3 个 基本 状态 之 间 的 转换 关系 。 等 待 基 个 事件 
进程 状态 转换 发 生变 化 的 原因 和 条 件 归根 到 底 图 3-1 进程 状态 转换 


源 于 进程 之 间 的 相互 制约 关系 。 对 进程 状态 的 转换 
过 程 ,需要 注意 如 下 3 点 : 

(1) 进程 从 等 待 状态 到 运行 状态 ,必须 经 过 就 绪 状 态 ,而 不 能 直接 转换 到 运行 状态 。 这 
是 因为 此 进程 等 待 的 原因 解除 后 ,系统 中 可 能 有 多 个 进程 都 处 于 可 运行 状态 (就 绪 状态 ) , 因 
此 系统 必须 按照 一 定 的 算法 选择 一 个 就 绪 进 程 占用 处 理 机 ,这 种 选择 过 程 被 称 为 进程 调度 


(Cschedule) 。 
(2) 一 个 进程 由 运行 状态 转变 为 等 待 状态 一 般 是 由 运行 中 的 进程 自己 主动 提出 的 。 例 
如 ,进程 在 运行 过 程 中 需要 某 一 条 件 而 不 能 满足 时 ,就 自己 主动 放弃 处 理 机 而 使 进程 转 入 等 


(3) 一 个 进程 由 等 待 状态 转变 为 就 绪 状 态 总 是 由 外 界 事件 引起 的 ,而 不 是 由 该 进程 自 


己 引 起 的 。 例 如 某 一 1/O 操作 完成 ,由 1/O 结束 中 断 来 解除 等 待 此 I/O 完成 的 进程 的 等 待 
状态 ,将 其 转换 为 就 绪 状 态 。 

以 上 3 种 状态 是 进程 最 基本 的 状态 ,在 实际 的 操作 系统 中 往往 不 止 这 3 种 状态 。 进 程 
的 状态 设置 和 规定 与 实际 的 操作 系统 设计 有 关 。 例 如 ,还 可 以 设置 自由 态 、 睡 眠 态 、 接 收 态 、 
停止 态 等 。 对 3 种 基本 状态 也 可 以 再 细 分 ,例如 ,分 为 静止 就 绪 、 活 动 就 绪 、 静 止 等 待 、 活 动 
等 待 等 。 这 些 状态 的 设立 和 状态 之 间 的 转换 均 与 系统 进程 的 调度 需要 有 关 , 根 据 操作 系统 
的 设计 目标 不 同 而 不 同 。 


3.2.2 进程 控制 块 


1. 进程 的 静态 描述 


进程 既然 是 一 个 动态 的 概念 ,那么 如 何 表示 一 个 进程 ,又 如 何 知道 进程 的 存在 呢 ? 显然 
在 系统 中 需要 有 描述 进程 存在 和 能 够 反映 其 变化 的 物理 实体 , 即 进程 的 静态 描述 。 进 程 的 
静态 描述 由 3 部 分 组 成 : 

(1) 程序 : 指 进程 运行 所 对 应 的 执行 代码 。 

(2) 数据 集合 : 指 程序 加 工 的 对 象 和 场所 。 是 进程 运行 中 必需 的 数据 资源 ,包括 对 
CPU 占用 、 存 储 器 .I/O 通道 等 的 需求 信息 。 

(1) 和 (2) 两 部 分 内 容 与 进程 的 执行 有 关 , 大 多 数 操作 系统 把 这 两 部 分 内 容 放 在 外 存 中 ， 
直到 该 进程 执行 时 再 调 入 内 存 。 

(3) 进程 控制 块 : 是 系统 为 每 个 进程 定义 的 一 个 数据 结构 。 它 包含 了 有 关 进 程 的 描述 
信息 ,控制 信息 和 资源 信息 ,是 进程 动态 特征 的 集中 反映 。 


2. 进程 控制 块 的 作用 


为 了 描述 和 控制 进程 的 运行 ,系统 为 每 个 进程 定义 了 一 个 数据 结构 一 一 进程 控制 块 
(Process Control Block ,PCB) , 它 是 操作 系统 中 最 重要 的 记录 型 数据 结构 。PCB 中 记录 了 
操作 系统 所 需 的 .用 于 描述 进程 的 当前 情况 以 及 进程 控制 运行 的 全 部 信息 。 进 程控 制 块 的 
作用 是 使 一 个 多 道 程序 环境 下 不 能 独立 运行 的 程序 ( 含 数据 ) 成 为 一 个 能 独立 运行 的 基本 单 
位 ,一 个 能 与 其 他 进程 并 发 执行 的 进程 。 或 者 说 操作 系统 是 根据 PCB 来 对 并 发 执行 的 进程 
进行 控制 和 管理 的 。 例 如 , 当 操 作 系 统 要 调度 某 进 程 时 ,从 该 进程 的 PCB 中 查 出 其 现行 状 
态 及 优先 级 ; 在 调度 到 某 进 程 后 ,要 根据 PCB 中 所 保存 的 处 理 机 状态 信息 ,设置 该 进程 恢 
复 运 行 的 现场 ,并 根据 其 PCB 中 程序 和 数据 的 内 存 始 址 ,找到 其 程序 和 数据 ; 进程 在 执行 
过 程 中 , 当 需 要 和 与 之 合作 的 进程 实现 同步 、 通 信和 访问 文件 时 .也 需要 访问 PCB; 当 进 程 
因 某 种 原因 而 暂停 执行 时 ,又 须 将 其 断 点 的 处 理 机 环境 保存 在 PCB 中 。 可 见 , 在 进程 的 整 
个 生命 周期 中 ,系统 总 是 通过 PCB 对 进程 进行 控制 的 , 亦 即 , 系 统 是 根据 进程 的 PCB 而 感 
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知 进程 的 存在 的 。 所 以 说 ,PCB 是 进程 存在 的 唯一 标志 。 

当 系 统 创建 一 个 新 进程 时 ,就 为 它 建立 了 一 个 PCB; 进程 结束 时 又 收回 其 PCB, 进 程 于 
是 也 随 之 消亡 。PCB 可 以 被 操作 系统 中 的 多 个 模块 (如 被 调度 程序 资源 分 配 程 序 、 中 断 处 
理 程序 以 及 监督 和 分 析 程 序 等 ) 读 或 修改 。 因 为 PCB 经 常 被 系统 访问 ,因此 ,在 几乎 在 所 有 
的 多 道 操作 系统 中 ,一 个 进程 的 PCB 全 部 或 部 分 常 驻 内 存 。 


3. 进程 控制 块 中 的 信息 


一 般 来 说 ,根据 操作 系统 的 要 求 不 同 ,进程 的 PCB 所 包含 的 内 容 会 多 少 有 所 不 同 。 但 
是 ,下 面 所 示 的 基本 信息 是 必需 的 。 

1) 描述 信息 

(1) 进程 标识 符 。 在 所 有 的 操作 系统 中 ,创建 一 个 进程 时 ,系统 即 为 该 进程 赋予 一 个 唯 
一 的 内 部 标识 符 , 以 便 系统 区 别 每 个 进程 。 

(2) 用 户 名 或 用 户 标识 符 。 每 个 进程 都 隶属 于 某 个 用 户 , 用 户 名 或 用 户 标识 符 有 利于 
资源 共享 与 保护 。 

(3) 家 族 关系 。 在 有 的 系统 中 ,进程 之 间 存 在 家 族 关系 。PCB 中 相应 的 项 描述 其 家 族 

2) 控制 信息 

(1) 进程 当前 状态 。 说 明 进 程 当前 处 于 何 种 状态 。 

(2) 进程 优先 级 。 是 选取 进程 占用 处 理 机 的 重要 依据 。 与 进程 优先 级 有 关 的 PCB 表 
项 有 占用 CPU 时 间 、 进 程 优先 级 偏 移 、 占 据 内 存 时 间 等 。 

(3) 程序 开始 地 址 。 指 出 该 进程 的 程序 从 此 内 存 地 址 开始 执行 。 

(4) 各 种 计时 信息 。 给 出 进程 占用 和 利用 资源 的 有 关 情 况 。 

(5) 通信 信息 。 记 录 进 程 在 运行 过 程 中 与 其 他 进程 通信 的 有 关 信息 。 

3) 资源 管理 信息 

(1) 占用 内 存 大 小 及 其 管理 用 数据 结构 指针 ,例如 后 面 介绍 的 内 存 管理 中 所 用 到 的 进 
程 页 表 指针 等 。 

(2) 在 某 些 复杂 系统 中 ,还 有 对 换 或 覆盖 用 的 有 关 信 息 , 如 对 换 程 序 段 长 度 . 对 换 外 存 
地 址 等 。 这 些 信息 在 进程 申请 、 释 放 内 存 时 使 用 。 

(3) 共享 程序 段 大 小 及 起 始 地 址 。 

(4) 输入 输出 设备 的 设备 号 ,所 要 传送 的 数据 长 度 、 缓 冲 地 址 、 缓 冲 长 度 及 所 用 设备 的 
有 关 数 据 结构 指针 等 。 这 些 信息 在 进程 申请 释放 设备 进行 数据 传输 时 使 用 。 

(5) 指向 文件 系统 的 指针 及 有 关 标 识 等 。 进 程 可 使 用 这 些 信息 对 文件 系统 进行 操作 。 

4) CPU 现场 保护 机 构 

处 理 机 状态 信息 主要 是 由 处 理 机 的 各 种 寄存 器 中 的 内 容 组 成 的 。 当 处 理 机 被 中 断 时 ， 
所 有 这 些 信息 都 必须 保存 在 PCB 中 ,以 便 在 该 进程 重新 执行 时 ,能 从 断 点 继续 执行 。 这 些 
寄存 器 包括 : 

(1) 通用 寄存 器 。 又 称 为 用 户 可 视 寄 存 器 ,它们 是 用 户 程序 可 以 访问 的 ,用 于 暂 存 信 
息 。 在 大 多 数 处 理 机 中 ,有 8 一 32 个 通用 寄存 器 ,在 RISC 结构 的 计算 机 中 可 超过 100 个 。 

(2) 指令 计数 器 。 其 中 存放 了 要 访问 的 下 一 条 指令 地 址 。 


(3) 程序 状态 字 PSW。 其 中 含有 状态 信息 ,如 条 件 码 .执行 方式 .中 断 屏 蔽 标志 等 。 

(4) 用 户 栈 指 针 。 每 个 用 户 进程 都 有 一 个 或 若干 与 之 相关 的 系统 栈 ,用 于 存放 过 程 和 
系统 调用 参数 及 调用 地 址 。 

例 3-2 ”一 种 用 C 语言 描述 的 PCB 结构 。 


struct pentry{int pid; // 进 程 标 识 符 
int pprio; // 进 程 优先 级 
char pstate; // 进 程 状态 
int pname; // 进 程 用 户 标识 符 
int msg; // 进 程 通信 信息 
int paddr // 进 程 对 应 的 程序 执行 地 址 
int pregs[SIZE]; // 现 场 保护 区 大 小 
}pcb[ ]; // 定 义 进程 控制 块 结构 数组 


可 见 , 通 过 这 些 表 项 内 容 ,标识 了 进程 的 存在 和 运行 ,集中 反映 了 进程 的 动态 特征 。 由 
此 系统 通过 PCB 就 可 以 对 进程 进行 管理 和 控制 。 


4. PCB 的 组 织 方 式 


在 一 个 系统 中 ,通常 可 拥有 数 十 个 、 数 百 个 乃至 数 千 个 PCB。 为 了 能 对 它们 加 以 有 效 
的 管理 ,应 该 用 适当 的 方式 将 这 些 PCB 组 织 起 来 。 目 前 常用 的 组 织 方式 有 两 种 。 

(1) 链接 队列 方式 。 处 于 相同 状态 的 PCB 组 成 队列 ,形成 运行 .就绪 和 阻塞 队列 。 每 
个 PCB 增加 一 个 链 指针 表 项 ,指向 队列 中 下 一 个 PCB 的 起 始 地 址 ,系统 中 设置 固定 单元 指 
出 各 单元 的 头 , 即 每 个 队列 第 一 个 PCB 的 起 址 。 运 行 队列 实际 上 只 有 一 个 成 员 , 用 运行 队 
列 指针 指向 它 即 可 。 就 绪 队列 的 排队 原则 与 调度 策略 有 关 。 阻 塞 队列 可 以 有 多 个 ,可 根据 
阻塞 原因 的 不 同 而 把 处 于 阻塞 状态 的 进程 的 PCB 排 成 等 待 1/O 操作 完成 的 队列 和 等 待 分 
配 内 存 的 队列 等 。 图 3-2 给 出 了 一 种 链接 队列 的 组 织 方式 。 











































































PCB 表 
执行 指针 PCB1 |4 
PCB2 3 
PCB3 0~ 
就 结 队列 指针 PCB4 [8 
PCB5 | | 
阻塞 队列 指针 Ee 二 | 
PCB7 9 
PCB8 0 
空闲 队列 指针 PCB9 ts 
: 1 


图 3-2 PCB 链接 队列 示意 图 


(2) 索引 表 方 式 。 系 统 根据 所 有 进程 的 状态 建立 几 张 索引 表 , 例 如 就 绪 索引 表 、 阻 塞 索 
引 表 等 ,并 把 各 索引 表 在 内 存 的 首 地 址 记录 在 内 存 的 一 些 专用 单元 中 。 在 每 个 索引 表 的 表 
目 中 ,记录 具有 相应 状态 的 某 个 PCB 在 PCB 表 中 的 地 址 。 图 3-3 给 出 了 索引 方式 的 PCB 
组 织 。 
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图 3-3 按 索 引 表 方式 组 织 PCB 











@.3 进程 的 控制 


进程 在 从 创建 到 消失 的 整个 生命 周期 中 状态 是 不 断 发 生变 化 的 。 那 么 ,如 何 控制 进程 
状态 的 变化 呢 ? 如 何 创建 和 撤销 一 个 进程 呢 ? 

操作 系统 的 进程 控制 机 构 控 制 进 程 的 状态 转换 。 进 程 的 控制 机 构 首先 表现 在 建立 、 撤 
销 ` 阻 塞 ,唤醒 等 方面 。 通 常 操作 系统 内 核 提供 了 称 作 原 语 的 具有 特定 功能 的 程序 段 来 完成 
进程 的 建立 、 撤 销 进程 以 及 完成 进程 各 状态 间 的 转换 。 

原 语 被 认为 是 机 器 语言 的 延伸 ,是 在 系统 核心 态 下 执行 的 ,由 一 条 或 若干 条 机 器 指令 组 
成 的 具有 特定 功能 的 程序 段 。 它 一 旦 被 启动 ,在 执行 期 间 是 不 可 中 断 的 。 操 作 系 统 原 语 对 
用 户 是 透明 的 ,一 般 不 允许 用 户 直接 使 用 ,以 避免 对 操作 系统 内 核 的 干扰 和 破坏 。 但 随 着 系 
统 的 发 展 ,为 方便 系统 程序 员 使 用 ,有 的 原 语 被 作为 一 种 特殊 的 系统 调用 , 既 提 供给 系统 进 
程 ,也 提供 给 用 户 进程 ,通过 系统 调用 方式 使 用 。 


3.3.1 进程 的 创建 原 语 
1. 进程 图 


一 个 进程 可 以 创建 若干 个 新 进程 ,新 创建 的 进程 又 可 以 继续 创建 进程 ,这 个 创建 过 程 形 
成 了 一 种 树 形 结构 ,在 操作 系统 中 称 为 进程 图 (process graph)。 进 程 图 是 一 棵 有 向 树 , 其 节 
点 代表 进程 ,分 枝 代表 创建 。 若 进程 A 创建 了 进程 BB, 称 A 是 BB 的 父 进程 (parent process)， 
而 B 称 为 A 的 子 进程 (progeny process) 。 进 程 树 形成 了 一 个 进程 “家 族 ”, 根 节点 为 该 家 族 
的 “祖先 (ancestor) 。 必 须 注 意 ,在 进程 图 中 ,进程 A 创建 了 进程 B, 但 并 不 意味 着 只 有 进 
程 A 执行 完 以 后 进程 B 才能 执行 ,而 是 A 和 B 可 以 并 发 执行 。 

了 解 进 程 间 的 这 种 关系 是 十 分 重要 的 。 因 为 子 进程 可 以 继承 父 进 程 所 拥有 的 资源 , 例 
如 ,继承 父 进 程 打开 的 文件 ,继承 父 进 程 所 分 配 到 的 缓冲 区 ,等 等 。 当 子 进程 被 撤销 时 ,应 将 
其 从 父 进程 那里 获得 的 资源 归还 给 父 进 程 。 此 外 ,在 撤销 父 进 程 时 ,也 必须 同时 撤销 其 所 有 
的 子 进程 。 为 了 标识 进程 之 间 的 家 族 关系 ,在 PCB 中 设置 了 家 族 关系 表 项 ,以 标明 自己 的 
父 进程 及 所 有 的 子 进程 。 


2. 引起 创建 进程 的 事件 


在 多 道 程序 环境 中 ,程序 只 有 成 为 进程 时 才能 在 系统 中 运行 。 因 此 ,为 使 程序 能 运行 ， 
就 必须 为 它 创建 进程 。 导 致 一 个 进程 创建 另 一 个 进程 的 典型 事件 可 有 以 下 4 类 : 

(1) 用 户 登录 。 在 分 时 系统 中 ,用 户 在 终端 输入 登录 命令 后 ,如 果 是 合法 用 户 , 系 统 将 
为 该 终端 建立 一 个 终端 进程 ,并 把 它 插入 就 绪 队 列 中 。 

(2) 作业 调度 。 在 批 处 理 系 统 中 , 当 作业 调度 程序 按 一 定 的 算法 调度 到 某 作业 时 , 便 将 
该 作业 装 入 内 存 , 为 它 分 配 必要 的 资源 ,并 立即 为 它 创 建 主 进程 ,再 插入 就 绪 队 列 中 。 

(3) 提供 服务 。 当 运行 中 的 用 户 程序 提出 某 种 请 求 后 ,系统 将 专门 创建 一 个 进程 来 提 
供用 户 所 需要 的 服务 ,例如 ,用 户 程序 要 求 进行 文件 打印 ,操作 系统 将 为 它 创建 一 个 打印 进 
程 ,这 样 ,不 仅 可 使 打印 进程 与 该 用 户 进程 并 发 执行 ,而 且 还 便于 计算 出 为 完成 打印 任务 所 
花费 的 时 间 。 

(4) 应 用 请 求 。 在 上 述 3 种 情况 下 ,都 是 由 系统 内 核 创建 一 个 新 进程 ; 而 第 4 类 事件 则 
是 基于 应 用 进程 的 需求 ,由 它 自己 创建 一 个 新 进程 ,以 便 使 新 进程 以 并 发 运行 方式 完成 特定 
任务 。 例 如 , 某 应 用 程序 需要 不 断 地 从 键盘 终端 该 入 用 户 输入 的 数据 ,继而 又 要 对 输入 数据 
进行 相应 的 处 理 , 然 后 再 将 处 理 结果 以 表格 形式 在 屏幕 上 显示 。 该 应 用 进程 为 使 这 几 个 操 
作 能 并 发 执行 ,以 加 速 任务 的 完成 ,可 以 分 别 建立 键盘 输入 进程 .数据 处 理 进程 和 表格 输出 
进程 。 

3. 进程 创建 原 语 





一 旦 操作 系统 发 现 了 要 求 创建 新 进程 的 事件 后 , 便 调用 进程 创建 原 语 按 下 述 步骤 创建 
一 个 新 进程 。 

(1) 申请 空白 PCB。 为 新 进程 申请 获得 唯一 的 数字 标识 符 , 并 从 PCB 集合 中 索取 一 个 
空白 PCB。 

(2) 为 新 进程 分 配 资源 。 为 新 进程 的 程序 和 数据 以 及 用 户 栈 分 配 必 要 的 内 存 空 间 。 显 
然 ,此 时 操作 系统 必须 知道 新 进程 所 需 内 存 的 大 小 。 对 于 批 处 理 作 业 ,其 大 小 可 在 用 户 提 出 
创建 进程 要 求 时 提供 。 若 是 为 应 用 进程 创建 子 进 程 , 也 应 是 在 该 进程 提出 创建 进程 的 请 求 
中 给 出 所 需 内 存 的 大 小 。 对 于 交互 型 作业 ,用户 可 以 不 给 出 内 存 要 求 而 由 系统 分 配 一 定 的 
空间 。 如 果 新 进程 要 共享 某 个 已 在 内 存 的 地 址 空间 ( 即 已 装 入 内 存 的 共享 段 ), 则 必须 建立 
相应 的 链接 。 

(3) 初始 化 进程 控制 块 。PCB 的 初始 化 包括 : 初始 化 标识 信息 。 将 系统 分 配 的 标识 
符 和 父 进程 标识 符 填 人 新 PCB 中 。 回 初始 化 处 理 机 状态 信息 。 使 程序 计数 器 指向 程序 的 
入 口 地 址 ,使 栈 指针 指向 栈 顶 。@@ 初 始 化 处 理 机 控制 信息 。 将 进程 的 状态 设置 为 就 绪 状 态 
或 静止 就 绪 状 态 。 对 于 优先 级 ,通常 是 将 它 设置 为 最 低 优先 级 ,除非 用 户 以 显 式 方式 提出 高 
优先 级 要 求 。 

(4) 将 新 进程 插入 就 绪 队 列 ,如 果 进 程 就 绪 队 列 能 够 接纳 新 进程 , 便 将 新 进程 插入 就 绪 
队列 。 
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3.3.2 进程 的 撤销 原 语 
1. 引起 进程 撤销 的 事件 


1) 正常 结束 

在 任何 计算 机 系统 中 ,都 应 有 一 个 用 于 表示 进程 已 经 运行 完成 的 指示 。 例 如 ,在 批 处 理 
系统 中 ,通常 ti Holt 指令 来 终止 程序 的 执行 。 当 程序 运行 到 Holt 指 
令 时 ,将 产生 一 个 中 断 ,通知 操作 系统 本 进程 已 经 完成 。 在 分 时 系统 中 ,用 户 可 利用 Logs 
off 表示 进程 运行 完毕 ,此 时 同样 可 产生 一 个 中 断 ,通知 操作 系统 进程 已 运行 完毕 。 

2) 异常 结束 

在 进程 运行 期 间 , 由 于 出 现 某 些 错 误 和 故障 而 迫使 进程 终止 。 这 类 异常 事件 很 多 ， 
常见 的 有 : @ 越 界 错误 。 这 是 指 程序 所 访问 的 存储 区 已 越 出 该 进程 的 区 域 。 四 保护 错 。 
进程 试图 访问 一 个 不 允许 访问 的 资源 或 文件 ,或 者 以 不 适当 的 方式 进行 访问 ,例如 ,进程 
试图 去 写 一 个 只 读 文 件 。@@ 非 法 指令 。 程 序 试图 执行 一 条 不 存在 的 指令 。 出 现 该 错误 
的 原因 可 能 是 程序 错误 地 转移 到 数据 区 ,把 数据 当成 了 指令 。@ 轩 特权 指令 错 。 用 户 进程 
试图 执行 一 条 只 允许 操作 系统 执行 的 指令 。@ 运 行 超时 。 进 程 的 执行 时 间 超 过 了 指定 
的 最 大 值 。@ 等 待 超时 。 人 @ 算 术 运 算 错 。 
进程 试图 执行 一 个 被 禁止 的 运算 ,例如 被 0 除 。@IO 故障 。 这 是 指 在 1/O 过 程 中 发 生 
了 错误 等 。 

3) 外 界 干预 

外 界 干预 并 非 指 在 进程 运行 中 出 现 了 异常 事件 .而 是 指 进程 应 外 界 的 请 求 而 终止 运行 。 
这 些 干预 有 : 四 操作 员 或 操作 系统 干预 。 由 于 某 种 原因 ,例如 发 生 了 死 锁 ,由 操作 员 或 操作 
系统 终止 该 进程 。@ 父 进程 请 求 。 由 于 父 进 程 具有 终止 自己 的 任何 子孙 进程 的 权利 ,因而 
当 父 进程 提出 终止 某 个 子孙 进程 的 请 求 时 ,系统 将 终止 该 进程 。@ 父 进程 终止 。 当 父 进程 
终止 时 ,操作 系统 也 将 其 所 有 子孙 进程 终止 。 


2. 进程 撤销 原 语 


如 果 系 统 中 发 生 了 上 述 要 求 撤 销 进 程 的 某 事件 后 ,操作 系统 便 调用 进程 撤销 原 语 , 按 下 
述 过 程 撤销 指定 的 进程 。 

(1) 根据 被 撤销 进程 的 标识 符 , 从 PCB 集合 中 检索 出 该 进程 的 PCB, 从 中 读 出 该 进程 
的 状态 。 

(2) 若 被 撤销 进程 正 处 于 执行 状态 ,应 立即 终止 该 进程 的 执行 ,并 置 调度 标识 为 真 ,用 
于 指示 该 进程 被 撤销 后 应 重新 进行 调度 。 

(3) 车 该 进程 还 有 子孙 进程 ,还 应 将 其 所 有 子孙 进程 子 以 撤销 ,以 防 它们 成 为 不 可 控 的 
进程 。 

(4) 将 被 撤销 进程 所 拥有 的 全 部 资源 归还 给 其 父 进程 或 者 归还 给 系统 。 

(5) 将 被 撤销 进程 ( 它 的 PCB) 从 所 在 队列 (或 链表 ) 中 移出 ,等 待 其 他 程序 使 用 。 





3.3.3 进程 的 阻塞 与 唤醒 原 语 
1. 引起 进程 阻塞 和 唤醒 的 事件 


下 述 几 类 事件 会 引起 进程 阻塞 或 被 唤醒 。 

1) 请 求 系统 服务 

当 正 在 执行 的 进程 请 求 操作 系统 提供 服务 时 ,由 于 某 种 原因 ,操作 系统 并 不 能 立即 满足 
该 进程 的 要 求 时 ,该 进程 只 能 转变 为 阻塞 状态 来 等 待 。 例 如 ,一 个 进程 请 求 使 用 某 资源 ,如 
打印 机 ,由 于 系统 已 将 打印 机 分 配给 其 他 进程 而 不 能 分 配给 请 求 进程 ,这 时 请 求 进程 只 能 被 
阻塞 , 仅 在 其 他 进程 释放 打印 机 的 同时 , 才 将 请 求 进 程 唤醒 。 

2) 启动 某 种 操作 

当 进 程 启动 某 种 操作 后 ,如 果 该 进程 必须 在 该 操作 完成 之 后 才能 继续 执行 , 则 必须 先 使 
该 进程 阻塞 ,以 等 待 该 操作 完成 。 例 如 ,一 个 进程 启动 了 某 1/O 设备 ,如 果 只 有 在 I/O 设备 
完成 了 指定 的 IO 操作 任务 后 ,进程 才能 继续 执行 , 则 该 进程 在 启动 了 1/O 操作 后 , 便 自动 
进入 阻塞 状态 去 等 待 。 在 IO 操作 完成 后 ,再 由 中 断 处 理 程序 或 中 断 进程 将 该 进程 唤醒 。 

3) 新 数据 尚未 到 达 

对 于 相互 合作 的 进程 ,如 果 其 中 一 个 进程 需要 先 获得 另 一 (合作 ) 进 程 提供 的 数据 才能 
运行 以 对 数据 进行 处 理 , 则 只 要 其 所 需 数据 尚未 到 达 , 该 进程 就 只 能 等 待 。 例 如 ,有 两 个 进 
程 ,进程 A 用 于 输入 数据 ,进程 B 对 输入 数据 进行 加 工 。 假 如 A 尚未 将 数据 输入 完毕 , 则 进 
程 B 将 因 没有 所 需 的 数据 而 等 待 ; 一 旦 进程 A 把 数据 输入 完毕 , 便 可 唤醒 进程 B。 

4) 无 新 工作 可 做 

系统 往往 设置 一 些 具有 某 个 特定 功能 的 系统 进程 ,每 当 这 种 进程 完成 任务 后 , 便 把 自己 
阻塞 起 来 以 等 待 新 任务 到 来 。 例 如 ,系统 中 的 发 送 进程 ,其 主要 工作 是 发 送 数据 , 若 已 有 的 
数据 已 全 部 发 送 完成 而 又 无 新 的 发 送 请 求 , 这 时 发 送 进程 将 使 自己 进入 等 待 状态 , 仅 当 又 有 
进程 提出 新 的 发 送 请 求 时 , 才 将 发 送 进程 唤醒 。 


2. 进程 阻塞 原 语 


当 发 生 上 述 某 事件 时 ,正在 执行 的 进程 由 于 无 法 继续 执行 ,于 是 便 通 过 调用 阻塞 原 语 把 
自己 阻塞 。 可 见 , 进 程 的 阻塞 是 进程 自身 的 一 种 主动 行为 。 进 入 阻塞 时 ,由 于 此 时 该 进程 还 
处 于 执行 状态 ,所 以 应 先 中 断 处 理 机 和 保存 该 进程 的 CPU 现场 。 然 后 把 该 进程 控制 块 中 
的 现行 状态 由 执行 改 为 阻塞 ,并 将 其 PCB 插入 阻塞 队列 。 如 果 系统 中 设置 了 因 不 同事 件 而 
阻塞 的 多 个 阻塞 队列 , 则 应 将 本 进程 插入 具有 相同 事件 的 阻塞 (等 待 ) 队 列 。 最 后 ,转调 度 程 
序 进 行 重新 调度 ,将 处 理 机 分 配给 另 一 就 绪 进程 。 这 里 , 转 进 程 调度 是 很 重要 的 ,否则 ,处 理 
机 将 会 出 现 空转 而 浪费 资源 。 





3. 进程 唤醒 原 语 


当 被 阻塞 进程 所 期 待 的 事件 出 现时 ,如 I/O 完成 或 其 所 期 待 的 数据 已 经 到 达 , 则 由 有 
关 进 程 (例如 ,用 完 并 释放 了 该 I/O 设备 的 进程 ) 调 用 唤醒 原 语 wakeup() ,将 等 待 该 事件 的 
进程 唤醒 。 响 醒 原 语 执 行 的 过 程 是 : 首先 把 被 阻塞 的 进程 从 等 待 该 事件 的 阻塞 队列 中 移 
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出 ,将 其 PCB 中 的 现行 状态 由 阻塞 改 为 就 绪 , 然 后 再 将 该 PCB 插入 到 就 绪 队 列 中 。 在 被 唤 
醒 进程 送 入 就 绪 队列 之 后 ,唤醒 原 语 既 可 以 返回 原 调用 程序 ,也 可 以 转向 进程 调度 。 

应 当 指出 ,阻塞 原 语 和 唤醒 原 语 是 一 对 作用 刚好 相反 的 原 语 。 因 此 ,如 果 在 某 进程 中 调 
用 了 阻塞 原 语 , 则 必须 在 与 之 相合 作 的 另 一 进程 中 或 其 他 相关 的 进程 中 安排 唤醒 原 语 ,以 唤 
醒 被 阻塞 进程 ; 否则 ,被 阻塞 进程 将 会 因 不 能 被 唤醒 而 长 久 地 处 于 阻塞 状态 ,从 而 再 无 机 会 
继续 运行 。 


@.4 进程 同步 


在 操作 系统 中 引入 进程 后 ,虽然 提高 了 资源 利用 率 和 系统 吞吐 量 , 但 是 在 进程 并 发 执行 
时 ,由 于 资源 共享 和 进程 的 合作 ,使 同一 系统 中 的 进程 之 间 可 能 产生 两 种 形式 的 制约 关系 ， 
即 直 接 制约 和 间接 制约 ,而 这 两 种 关系 通常 表现 在 两 类 问题 上 : 同步 和 互 斥 。 进 程 同步 机 
构 的 主要 任务 是 使 并 发 执行 的 诸 进 程 之 间 能 有 效 地 共享 资源 和 相互 合作 ,从 而 使 程序 的 执 
行 具 有 可 再 现 性 。 


3.4.1 互 斥 


并 发 进程 可 以 共享 系统 中 的 各 种 资源 ,但 是 系统 中 某 些 资源 具有 一 次 仅 允 许 一 个 进程 
使 用 的 属性 ,这样 的 资源 称 为 临界 资源 (critical resource) 。 例 如 ,一 台 打 印 机 , 若 让 多 个 进 
程 任意 使 用 ,那么 很 容易 发 生 多 个 进程 的 输出 结果 交织 在 一 起 的 混乱 情况 ,解决 这 一 问题 叭 
一 的 办 法 就 是 一 个 进程 提出 打印 申请 并 得 到 许可 后 ,打印 机 一 直 被 它 单独 占用 。 如 果 在 此 
过 程 中 , 另 一 进程 也 提出 申请 ,那么 它 必 须 等 待 前 一 进程 释放 了 打印 机 以 后 才 可 使 用 。 

系统 中 有 很 多 的 物理 设备 属于 临界 资源 ,如 卡片 输入 输出 机 、 打 印 机 、 磁 带 机 等 ,不 仅 硬 
件 可 以 是 临界 资源 ,软件 中 的 变量 .数据 ,表格 都 可 以 是 临界 资源 。 下 面 通过 一 个 例子 来 说 
明 临 界 资源 的 概念 。 

例 3-3 假设 在 一 个 飞机 售票 系统 中 , 某 一 时 刻 数据 库 中 关于 某 一 航班 的 机 票数 量 
counter 王 5。 某 一 窗口 的 售票 进程 执行 的 一 条 操作 语句 是 counter 二 counter 一 1, 而 男 一 窗 
口 退票 进程 执行 的 一 条 操作 语句 是 counter 一 counter 十 1。 

用 高 级 语言 书写 的 语句 counter 二 counter 十 1 和 counter 二 counter 一 1 所 对 应 的 汇编 语 
言 指令 如 下 : 


LOAD A, counter; LOAD B, counter; 
AD A,1; SUB B, 1; 
STORE A, counter; STORE B, counter; 


如 果 让 售票 进程 和 退票 进程 顺序 执行 ,其 结果 是 正确 的 ; 但 如 果 并 发 执行 ,就 会 出 现 差 
错 。 问 题 就 在 于 这 两 个 进程 共享 了 变量 counter。 

如 果 退 票 进程 先 执行 左 列 的 3 条 机 器 语言 语句 ,然后 售票 进程 再 执行 右 列 的 3 条 语句 ， 
则 最 后 共享 变量 counter 的 值 仍 为 5; 反之 ,如 果 让 售票 进程 先 执行 右 列 的 3 条 语句 ,然后 
再 让 退票 进程 执行 左 列 的 3 条 语句 ,counter 值 也 还 是 5。 但 是 ,如 果 按 下 述 顺 序 执行 : 


LOAD A, counter; (A=5) 


RDD  R 17 (R=6) 
LOAD B, counter; (B=5) 
SUB B, 1; (B= 4) 


STORE A, counter; (counter=6) 

STORE B, counter; (counter = 4) 

则 counter 值 是 4, 显 然 不 是 用 户 想 要 的 值 。 读 者 可 以 自己 试 试 ,倘若 再 将 两 段 程序 中 
各 语句 交叉 执行 的 顺序 改变 ,又 可 能 得 到 counter 二 6 的 答案 ,这 表明 程序 的 执行 已 经 失去 
了 可 再 现 性 。 为 了 预防 产生 这 种 错误 ,解决 此 问题 的 关键 是 把 变量 counter 作为 临界 资源 
处 理 , 即 , 令 售票 进程 和 退票 进程 共享 同一 变量 counter 的 那 段 代码 不 能 交叉 执行 。 

进程 中 访问 临界 资源 的 那 段 代 码 称 为 关于 该 临界 资源 的 临界 区 (critical section) 。 如 
上 例 中 的 counter 王 counter 十 1 和 counter 王 counter 一 1 语句 。 涉 及 同一 临界 资源 的 不 同 进 
程 中 的 临界 区 称 为 同类 临界 区 。 以 后 不 加 特别 说 明 , 均 指 同类 临界 区 。 

有 了 临界 区 的 概念 后 ,进程 的 互 斥 就 可 以 描述 为 : 一 组 并 发 进程 中 的 两 个 或 多 个 程序 
段 , 因 共享 某 一 公有 资源 而 使 得 这 组 并 发 进程 不 能 同时 进入 临界 区 的 关系 称 为 进程 的 互 斥 。 

由 前 述 可 知 ,不 论 硬 件 临界 资源 还 是 软件 临界 资源 ,系统 中 多 个 进程 必须 互 斥 地 对 它们 
进行 访问 。 显 然 , 若 能 保证 进程 互 斥 地 进入 自己 的 临界 区 ,就 能 实现 诸 进程 对 临界 资源 的 互 
斥 访问 。 为 此 ,必须 有 软件 方法 或 同步 机 构 来 协调 它们 。 该 算法 或 同步 机 构 应 遵循 下 述 调 
度 准则 : 

(1) 独立 平等 。 不 能 假设 各 并 发 进程 的 相对 执行 速度 。 即 各 并 发 进程 享有 平等 的 、 独 
立 的 竞争 共享 资源 的 权利 。 

(2) 空闲 让 进 。 并 发 进程 中 的 某 个 进程 不 在 临界 区 时 , 它 不 阻止 其 他 进程 进入 临界 区 。 

(3) 互 斥 进入 。 并 发 进程 中 的 若干 个 进程 申请 进入 临界 区 ,只 能 允许 一 个 进程 进入 ,以 
保证 临界 资源 的 互 斥 使 用 。 

(4) 让 权 等 待 。 当 进程 不 能 进入 自己 的 临界 区 时 ,应 立即 释放 人 处理 机 ,以 免 进 程 陷入 
“人 等 ”。 

(5) 有 限 等 待 。 并 发 进程 中 的 某 个 进程 从 申请 进入 临界 区 时 开始 ,应 在 有 限 的 时 间 内 
进入 临界 区 ,以 免 进程 陷入 “ 死 等 ”。 

这 里 ,准则 (4) 遵 循 了 “ 尽 可 能 提高 CPU 的 有 效 利用 率 ” 的 操作 系统 设计 目标 ; 准则 (5) 
是 并 发 进程 不 发 生死 锁 (关于 死 锁 ,将 在 4.5 节 中 介绍 ) 的 重要 保证 。 


3.4.2 进程 的 同步 


在 并 发 系统 中 ,进程 之 间 除 了 对 公有 资源 的 竞争 而 引起 的 间接 制约 之 外 ,还 存在 着 直接 
的 制约 关系 ,现在 结合 下 例 来 讨论 这 类 制约 问题 。 

例 3-4 在 控制 测量 系统 中 ,数据 采集 任务 反复 把 所 采集 的 数据 送 入 一 个 单 缓冲 区 ; 计 
算 任务 不 断 从 该 单 缓冲 区 中 取出 数据 进行 计算 。 它 们 之 间 具 有 相互 的 制约 关系 。 即 ,数据 
采集 进程 未 把 数据 放 和 缓冲 区 ,缓冲 区 空 时 ,计算 进程 不 应 执行 取 数 的 过 程 ; 同样 , 当 缓冲 
区 满 时 ,计算 进程 还 没有 取 走 一 个 数据 时 ,数据 采集 进程 不 能 执行 放 数 的 过 程 。 如 果 不 采取 
任何 制约 机 制 , 则 数据 采集 过 程 (collection) 和 计算 过 程 (calculate) 相 应 的 程序 段 分 别 描述 
如 下 : 
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var buf; // 定 义 一 个 全 局 缓冲 区 
int flag= 0; // 定 义 一 个 缓冲 区 状态 标志 ,0 表示 空 ,1 表示 满 
collection() // 数 据 采 集 过 程 向 缓冲 区 送 入 数据 
{ 
while (TRUE) 
采集 数据 ; 
while(flag==1); // 重 复 测试 缓冲 区 是 否 满 
将 采集 的 数据 放 入 buf; 
flag=1; 
} 
calculate() // 计 算 过 程 从 缓冲 区 中 取 走 数据 
{ 
while( TRUE) 





while(flag== 0); // 重 复 测试 缓冲 区 是 否 空 
从 buf 中 取出 数据 ; 

flag= 0; 

计算 处 理 ; 


} 

为 了 简化 问题 ,在 此 假设 不 考虑 共享 变量 flag 的 互 斥 访 问 。 

显然 ,上 述 进 程 的 并 发 执行 会 造成 CPU 执行 时 间 的 极 大 浪费 (因为 其 中 包含 两 处 反复 
测试 的 语句 ) ,这 是 操作 系统 设计 不 允许 的 。 由 于 数据 采集 任务 和 计算 任务 在 执行 过 程 中 存 
在 相互 的 制约 关系 ,造成 了 这 种 浪费 。 这 种 现象 在 多 道 操作 系统 和 用 户 进程 中 大 量 存在 。 

我 们 把 异步 环境 下 的 一 组 并 发 进程 ,在 某 些 程 序 段 上 需 互 相合 作 、 互 相等 待 ,使 得 各 进 
程 在 某 些 程序 段 上 必须 按 一 定 的 顺序 执行 的 制约 关系 称 为 进程 间 同 步 。 具 有 同步 关系 的 一 
组 并 发 进程 称 为 合作 进程 。 

无 论 是 互 斥 还 是 同步 ,都 是 在 执行 的 时 间 顺 序 上 对 并 发 进程 的 操作 加 以 某 种 限制 。 对 
于 互 斥 的 进程 ,它们 各 自 单独 执行 时 都 是 正确 的 ,但 在 临界 区 内 不 能 混在 一 起 交替 执行 , 需 
互 斥 地 执行 ,至 于 哪个 进程 先进 入 临界 区 则 无 所 谓 。 而 对 于 同步 的 进程 ,各 自 单独 执行 会 产 
生 错 误 ,必须 互相 配合 ,共同 推进 ,各 合作 进程 对 公共 变量 的 那 部 分 操作 必须 严格 地 按照 一 
定 的 先后 顺序 执行 。 由 此 可 见 , 互 斥 和 同步 对 操作 时 间 顺 序 所 加 的 限制 是 不 同 的 。 


3.4.3 同步 机 构 


从 以 上 讨论 可 知 ,为 了 保证 进程 间 的 正确 执行 ,操作 系统 中 必须 引入 一 种 机 制 来 控制 进 
程 间 的 互 斥 和 同步 关系 ,以 保证 进程 执行 结果 的 可 再 现 性 。 系 统 中 用 来 实现 进程 间 同 步 与 
互 斥 的 机 构 统 称 为 同步 机 构 。 大 多 数 同步 机 构 采用 一 个 物理 实体 ,如 锁 、 信 息 量 等 ,并 提供 
相应 的 原 语 。 系 统 通 过 这 些 同 步 原 语 来 控制 对 共享 资源 或 公共 变量 的 访问 ,以 实现 进程 间 
的 同步 与 互 斥 。 


1. 加 锁 / 开 锁 原 语 
3.4.2 节 中 ,给 出 了 临界 区 的 描述 方法 和 并 发 进程 互 斥 执行 时 所 必须 遵守 的 准则 ,但 是 


并 没有 给 出 怎样 实现 并 发 进程 的 互 斥 。 人 们 可 能 认为 只 需 把 临界 区 中 的 各 个 过 程 按 不 同 的 
时 间 排 列 , 再 依次 调用 就 行 了 。 但 事实 上 这 是 不 可 能 的 。 因 为 这 要 求 该 组 并 发 进程 中 的 每 
个 进程 事先 知道 其 他 并 发 进程 与 系统 的 动作 ,由 用 户 程序 执行 开始 的 随机 性 可 知 ,这 是 不 可 
能 的 。 

一 种 可 能 的 办 法 是 对 临界 区 加 锁 以 实现 互 斥 。 当 某 个 进程 进入 临界 区 之 后 , 它 将 锁 上 
临界 区 ,直到 它 退 出 临界 区 时 为 止 。 并 发 进程 在 申请 进入 临界 区 时 ,首先 测试 该 临界 区 是 否 
是 上 锁 的 ,如 果 该 临界 区 已 被 锁 住 , 则 该 进程 要 等 到 该 临界 区 开锁 之 后 才 有 可 能 获得 临界 
区 。 为 此 ,操作 系统 通常 提供 加 锁 / 开 锁 原 语 来 保证 进程 的 互 斥 执行 。 

用 一 个 变量 wo 来 代表 某 种 临界 资源 的 状态 。w=1 表示 某 资 源 可 用 ,可 进入 临界 区 ， 
w 二 0 表示 资源 正在 被 使 用 (临界 区 正在 被 执行 ) 。 

加 锁 原 语 LOCK(ow) 定 义 如 下 : 

(1) 测试 w 是 否 为 1。 

(2) 若 wo=1, 则 0 一 ow。 

(3) 车 w= 二 0, 则 返回 (1)。 

开锁 原 语 UNLOCK(w) 只 有 一 个 动作 , 即 1 一 w。 

利用 加 锁 /开锁 原 语 , 可 以 很 方便 地 实现 进程 互 斥 。 当 某 进 程 要 进入 临界 区 时 ,首先 执 
行 LOCK(w) 原 语 。 这 时 ,车 w= 二 1, 表 示 没 有 别 的 进程 进入 此 临界 资源 的 临界 区 ,于 是 它 可 
进入 并 同时 设置 w= 二 0, 禁 止 其 他 进程 的 进入 ; 若 w= 二 0, 则 表示 有 进程 正在 访问 此 临界 资源 ， 
它 需 循环 测试 等 待 。 当 一 个 进程 退出 临界 区 时 ,必须 执行 UNLOCK(w) 原 语 ,否则 任何 进 
程 ,包括 它 自己 ,都 无 法 再 使 用 该 共享 资源 。 加 锁 后 的 临界 区 程序 描述 如 下 : 

Pro() 


{ 


LOCK(w) 

< 临界 区 > 

UNLOCK(w) 
} 


加 锁 /开锁 原 语 可 以 用 关中 断 的 方式 实现 ,在 进入 锁 测试 之 前 关闭 中 断 ,直到 完成 锁 测 
试 并 加 锁 之 后 才 开 中 断 。 加 锁 /开锁 还 可 在 不 同 计算 机 上 用 不 同 的 硬件 指令 实现 。 加 锁 / 开 
锁 机 制 的 优点 是 简单 、 易 实现 。 其 缺点 是 循环 测试 锁定 位 将 损耗 较 多 的 CPU 时 间 , 不 能 遵 
循 “ 让 权 等 待 ”的 准则 ,而 使 进程 陷入 “ 忙 等 ”。 


2. 信号 量 和 P、V 原 语 


1) 信号 量 

信号 是 铁路 交通 管理 中 的 一 种 常用 设备 ,交通 管理 人 员 利 用 信号 颜色 的 变化 来 实现 交 
通 管理 。 在 操作 系统 中 ,利用 信号 量 (semaphores) 来 表征 一 种 资源 或 状态 ,通过 对 信号 量 
的 改变 来 表征 进程 对 资源 的 使 用 状况 ,或 判断 信号 量 的 值 控制 进程 的 状态 。 

1965 年 荷兰 科学 家 E. W. Dijkstra 提出 了 支持 进程 互 斥 和 同步 管理 的 信号 量 技术 方 
案 。 实 际 上 他 定义 的 信号 量 是 一 个 整 型 变量 ,具有 两 个 基础 的 原 语 ,并 用 荷兰 语 命名 为 
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Prolangen (降低 ) 和 Verhogen( 升 起 ) 操 作 ,简称 P、V 操作 。 

信号 量 S 定义 如 下 : 

(1) S 是 一 个 整 型 变量 而 且 初 值 非 负 。 

(2) 对 信号 量 仅 能 实施 P(S) 操 作 和 V(S) 操 作 , 也 只 有 这 两 种 操作 才能 改变 S 的 值 。 

(3) 每 一 个 信号 量 都 对 应 一 个 ( 空 或 空 非 的 ) 等 待 队列 ,队列 中 的 进程 处 于 等 待 状态 。 

2) P(S)、V(S) 原 语 

P 原 语 操作 的 主要 动作 如 下 : 

(1) S 减 1。 

(2) 若 S 减 1 后 仍 大 于 或 等 于 零 , 则 进程 继续 执行 。 

(3) 若 S 减 1 后 小 于 零 , 则 该 进程 被 阻塞 并 进入 该 信号 的 等 待 队列 中 , 然后 转 进 程 

V 原 语 操作 的 主要 动作 如 下 : 

(1) S 加 1。 

(2) 若 相 加 结果 大 于 零 ,进程 继续 执行 。 

(3) 若 相 加 结果 小 于 或 等 于 零 , 则 从 该 信号 的 等 待 队列 中 唤醒 一 个 等 待 进程 ,然后 再 返 
回 原 进程 继续 执行 或 转 进程 调度 。 

需要 指出 的 是 ,P、V 操作 具有 严格 的 不 可 分 割 性 ,这 包含 两 层 含义 : 

(1) 由 于 信号 量 是 系统 中 的 公共 变量 , 它 可 由 若干 进程 所 访问 ,因此 ,P、V 操作 的 执行 
绝对 不 允许 被 中 断 , 以 保证 在 任 一 时 刻 只 能 有 一 个 进程 对 某 一 信号 量 进行 操作 。 换 言 之 ,对 
某 一 信号 量 的 操作 必须 是 互 斥 的 。 

(2) P、V 操作 是 一 对 操作 , 若 有 对 信号 量 S 的 P 操作, 必须 也 有 对 信号 量 S 的 V 操作 ， 


反之 亦 然 。 
关于 P、V 原 语 的 实现 ,有 许多 方法 。 这 里 介绍 一 种 使 用 加 锁 法 的 软件 实现 方法 ,其 实 
现 过 程 描述 如 下 : 
P(S) 
{ 
lock( 1o0ckbit); // 封 锁 中 断 
S=S-1; 
if S<0 
block(S,L); // 将 当前 进程 阻塞 ,插入 S 的 等 待 队 列 
unlock(1ockbit) // 开 放 中 断 
} 
V(S) : 
lock( lockbit); // 封 锁 中 断 
S=S+1; 
if S<=0 
wakeup(S,L); // 将 S 的 等 待 队列 中 的 某 一 进程 唤醒 


unlock(lockbit); // 开 放 中 断 


3) P、V 操作 的 物理 意义 

在 共享 同一 类 资源 的 具有 相互 合作 关系 的 进程 之 间 , 信 号 量 的 初 值 用 来 表示 系统 中 同 
类 资源 的 可 用 数目 。 因 此 , 当 S=0 时 ,表示 没有 空闲 的 该 类 资源 可 用 ; S<=0 时 ,其 绝对 值 
表示 因 请 求 该 类 资源 而 被 阻塞 的 进程 数 ; 每 执行 一 次 了 操作 意味 着 请 求 分 配 一 个 单位 的 某 
类 资源 ,因此 描述 为 SS 一 1; 车 S<=0 表示 已 无 该 类 资源 可 供 分 配 , 因 此 把 该 进程 排列 到 
与 该 S 相关 的 等 待 队列 中 。 进 程 使 用 完 某 类 资源 必须 执行 一 次 V 操作 ,意味 着 释放 一 个 单 
位 的 该 类 资源 ,因此 描述 为 S=S 十 1; 车 S 过 0 表示 已 有 进程 在 等 待 该 类 资源 ,因此 唤醒 等 
待 队列 中 的 第 一 个 或 优先 级 最 高 的 进程 ,允许 其 使 用 该 类 资源 。 

在 具有 相互 合作 的 同步 关系 的 进程 之 间 , 信 号 量 还 可 代表 合作 进程 之 间 的 消息 ,每 一 个 
P 操作 意味 着 等 待 合作 进程 发 来 一 个 消息 (或 信号 ) ,每 一 个 V 操作 表示 向 合作 进程 发 送 一 
个 消息 。 

现代 操作 系统 中 ,针对 不 同 的 信号 对 象 所 采用 的 P、V 操作 含义 和 概念 有 了 改变 ,例如 ， 
P 操作 称 为 down 和 wait 操作 ,V 操作 称 为 up 和 signal 操作 。 


3. 管 程 


信号 量 机 制 是 解决 进程 互 斥 .同步 问题 的 有 效 工 具 , 但 前 提 是 信号 量 设 置 .其 初 值 的 确 
定 以 及 相关 进程 中 安排 P、V 操作 的 位 置 必须 正确 ,和 否则 同样 也 会 造成 与 时 间 有 关 的 错误 ， 
有 时 甚至 造成 死 锁 。Dijkstra 于 1971 年 提出 ,把 所 有 进程 对 某 一 临界 资源 的 互 斥 、 同 步 操 
作 都 集中 起 来 ,构成 所 谓 的 “秘书 ”进程 。1975 年 ,Hansen 和 Hoare 又 把 “秘书 ”进程 思想 发 
展 为 管 程 概念 ,把 并 发 进程 间 的 互 斥 、 同 步 操作 分 别 集中 于 相应 的 管 程 中 。 

1) 管 程 的 组 成 

如 图 3-4 所 示 , 管 程 是 由 局 部 于 自己 的 若干 公共 变量 及 其 说 明和 所 有 访问 这 些 公共 变 
量 的 过 程 所 组 成 的 软件 模块 或 软件 包 。 
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图 3-4 管 程 结 构 
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管 程 有 3 个 组 成 部 分 : 
(1) 局 部 于 管 程 的 共享 变量 说 明 (数据 结构 定义 )。 这 些 共享 数据 表示 相应 资源 的 状 
态 ; 局 部 于 管 程 的 数据 结构 仅 能 被 局 部 于 管 程 的 过 程 所 访问 ; 局 部 于 管 程 的 过 程 只 能 访问 
管 程 内 部 的 数据 结构 。 管 程 相当 于 围墙 ,所 有 进程 要 访问 临界 资源 时 ,必须 进入 管 程 。 
(2) 对 数据 结构 进行 操作 的 一 组 过 程 。 是 每 个 过 程 完成 前 关于 上 述 数据 结构 的 某 种 规 
定 的 操作 。 
(3) 对 局 部 于 管 程 的 数据 设置 初始 值 等 语句 。 
2) 管 程 的 基本 形式 
管 程 的 基本 形式 如 下 : 
TYPE < 管 程 名 > = MONITOR 
variable; 
condition; 
procedure < 过 程 名 >(< 形 式 参数 表 >) ; 
begin 
< 过 程 体 >; 
end; 


procedure < 过 程 名 >(< 形 式 参 数 表 >) ; 
begin 
< 过 程 体 >; 
end; 
begin 
< 管 程 的 局 部 数据 初始 化 语句 >; 
end; 

3) 实现 管 程 的 3 个 关键 问题 

实现 管 程 时 必须 考虑 3 个 关键 问题 , 即 互 斥 .同步 和 条 件 变 量 。 

(1) 互 斥 。 管 程 的 执行 是 互 斥 的 ,以 保证 进程 互 斥 地 访问 临界 资源 。 当 几 个 进程 都 需 
调用 某 一 管 程 时 , 仅 允 许 一 个 进程 调用 进入 管 程 ,而 其 他 调用 者 必须 等 待 。 管 程 的 互 斥 由 编 
译 器 负责 ,编译 器 知道 管 程 的 特殊 性 (只 有 部 分 语言 支持 ) 。 调 用 管 程 的 程序 员 无 须知 道 编 
译 器 是 如 何 实现 互 斥 的 ,只 需 知道 将 所 有 的 临界 区 转换 成 管 程 的 过 程 即 可 。 

(2) 同步 。 在 管 程 中 必须 设置 两 个 同步 操作 原 语 wait 和 signal。 当 进程 通过 管 程 请 求 
访问 共享 数据 而 未 能 满足 时 , 管 程 便 调用 wait 原 语 使 该 进程 阻塞 .并 释放 管 程 ,此 时 其 他 进 
程 可 使 用 该 管 程 。 当 另 一 进程 访问 完 该 共享 数据 且 释 放 后 , 管 程 便 调 用 signal 原 语 ,唤醒 等 
待 队列 中 的 队 首 进程 。 

(3) 条 件 变量 。 为 了 区 别 等 待 的 不 同 原 因 , 管 程 又 引入 了 条 件 变量 。 不 同 的 条 件 变量 
对 应 不 同 原 因 的 进程 阻塞 等 待 队 列 ,初始 时 为 空 。 在 条 件 变 量 上 能 作 wait 和 signal 原 语 操 
作 , 若 条 件 变 量 名 为 c, 则 调用 同步 原 语 的 形式 为 wait. c 和 signal. c。( 此 处 wait 只 是 使 进 
程 等 待 ,并 不 改变 c 的 值 , 同 理 ,signal 只 是 唤醒 等 待 的 进程 ,注意 它们 与 PV 的 区 别 ) 。 


3.4.4 同步 机 构 应 用 
由 前 述 可 知 , 信 号 量 S 是 一 个 整数 。 在 S 大 于 或 等 于 0 时 代表 可 供 并 发 进程 使 用 的 资 


源 实 体 数 ,但 S 小 于 0 时 则 表示 正在 等 待 使 用 该 类 资源 的 进程 数 。 因 而 建立 一 个 信号 量 必 
须 说 明 信 和 号 量 所 代表 的 意义 ,并 赋 初 值 以 及 建立 相应 的 数据 结构 ,以 便 指 向 那些 等 待 使 用 该 
临界 区 的 进程 。 显 然 , 用 于 互 斥 的 信号 量 S 的 初 值 应 为 1, 而 用 于 同步 的 信号 量 的 初 值 应 大 
于 或 等 于 0。 


1. 用 信号 量 实现 进程 互 斥 


利用 P、V 原 语 和 信号 量 ,可 以 方便 地 解决 并 发 进程 的 互 斥 问题 。 对 于 一 组 具有 互 斥 关 
系 的 进程 ,只 须 设置 一 个 互 斥 信号 量 mutex', 在 临界 区 的 前 后 加 入 P、V 原 语 即 可 。 

例 3-5 用 信号 量 实现 两 个 并 发 进程 PA、Ps 互 斥 的 描述 。 

由 于 信号 量 初始 值 为 1 ,表示 没有 何 进程 进入 临界 区 , 当 某 一 进程 进入 临界 区 之 前 , 首 
先 执行 P 原 语 操 作 之 后 将 mutex 的 值 变 为 0, 表示 已 有 进程 可 以 进入 临界 区 。 这 时 如 果 有 
进程 要 进入 临界 区 ,首先 也 必须 执行 P 原 语 操作 将 mutex 的 值 变 为 一 1, 该 进程 将 阻塞 。 以 
此 类 推 ,在 第 一 个 进程 退出 临界 区 之 前 ,其 他 任何 进程 都 不 能 进入 临界 区 。 直 到 第 一 个 进程 
执行 完 临界 区 操作 ,然后 执行 V 原 语 操作 之 后 , 才 可 唤醒 某 个 等 待 进程 进入 就 绪 队 列 ,经 调 
度 后 再 进入 临界 区 。 

semp mutex = 1; // 互 斥 信号 量 


BA() Ps() 
{ { 


P(mutex); P(mutex); 


临界 区 操作 ; 临界 区 操作 ; 


V(mutex); V(mutex); 
} | } 
注意 : 利用 P、V 原 语 和 信号 量 机 制 实现 进程 间 的 互 斥 执行 , 则 P、V 操作 必须 成 对 出 现 


在 同一 个 进程 里 ,如 果 丢 失 V 操作 将 会 导致 一 些 进程 永远 不 会 被 唤醒 ,如 果 丢 失 卫 操作 将 
不 能 保证 临界 资源 的 互 斥 使 用 。 


2. 用 信号 量 实现 进程 同步 


用 信号 量 实现 一 组 合作 进程 间 的 同步 执行 ,通常 首先 设立 与 进程 执行 条 件 有 关 的 信号 
量 , 然 后 为 信号 量 赋 初 值 , 最 后 利用 P、V 原 语 规 定 各 进程 的 执行 顺序 。 

例 3-6 用 P、V 原 语 实现 例 3-4 中 的 数据 采集 进程 和 计算 进程 的 同步 执行 。 

对 于 数据 采集 进程 ,每 次 放 数 之 前 必须 申请 一 个 空 的 缓冲 区 ,因此 ,为 进程 collection 设 
置 一 个 信号 量 Bufempty, 代表 缓冲 区 是 否 为 空 (可 用 ), 其 初始 值 为 1。 而 对 于 计算 进程 
calculate, 每 次 取 数 之 前 必须 申请 一 个 装 满 数 据 的 缓冲 区 ,因此 ,为 进程 calculate 设置 一 个 
信号 量 Buffull, 代 表 缓 冲 区 是 否 装 满 数据 ,其 初始 值 为 0。 其 相应 的 程序 段 分 别 描述 如 下 : 


var buf; // 定 义 一 个 全 局 缓冲 区 
semp Bufempty= 1; // 设 置信 号 量 Bufempty, 表示 缓冲 区 是 否 为 空 
semp Buffull = 0; // 设 置信 号 量 Buffull 表示 缓冲 区 是 否 装 满 数据 


collection() // 数 据 采 集 进程 向 缓冲 区 送 数 
{ 
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while (TRUE) 
{ 
采集 数据 ; 
P(Bufempty) ; // 申 请 一 个 空 的 缓冲 区 
将 采集 的 数据 放 入 buf; 
V(Bufful1) // 释 放 一 个 满 的 缓冲 区 
} 
calculate() // 计 算 进 程 从 缓冲 区 中 取 走 数据 
{ 
while( TRUE) 
《 
P(Bufful1); // 申 请 一 个 满 的 缓冲 区 
从 buf 中 取出 数据 ; 
V(Bufempty) ; // 释 放 一 个 空 的 缓冲 区 
计算 处 理 ; 
} 
} 


数据 采集 进程 collection 在 送 数 之 前 ,首先 执行 P(Bufempty) 操 作 , 申 请 一 个 空 的 缓冲 
区 。 执 行 了 操作 后 , 若 Bufempty 二 0, 表 示 没 有 足够 的 空 缓冲 区 ,进程 collection 阻塞 ,否则 
表示 可 以 把 数据 送 入 buf。 把 数据 送 入 buf 后 ,执行 V(Buffull) ,释放 一 个 满 的 缓冲 区 ,表示 
buf 中 有 数 可 取 。 计 算 进 程 calculate 在 取 数 前 首先 执行 PC(Buffull) ,申请 一 个 满 的 缓冲 区 ， 
若 Buffull 一 0 ,表示 缓 冲 区 空 ,进程 calculate 阻塞 自己 ,否则 取 走 数据 。 计 算 进 程 calculate 
取 走 数据 后 ,执行 V(Bufempty) ,表示 buf 已 空 .唤醒 进程 collection 送 数 。 


3. 利用 信号 量 实现 前 趋 关 系 


前 趋 图 Cprecedence graph) 是 一 个 有 向 无 环 图 , 记 为 DAG(Directed Acyclic Graph) ,用 
于 描述 进程 之 间 执 行 的 前 后 关系 。 图 中 的 每 个 节点 可 用 于 描述 一 个 程序 段 或 一 个 进程 乃至 
一 条 语句 ; 节点 间 的 有 向 边 则 用 于 表示 两 个 节点 之 间 存 在 的 偏 序 (Partial Order) 关 系 或 前 
序 关系 (Precedence Relation) , 记 作 P; 一 Pj ,表示 P, 执行 完 以 后 ,P; 才 可 以 开始 执行 , 称 P， 
是 P; 的 直接 前 趋 ,P; 是 P; 的 直接 后 继 。 

例 3-7 对 于 下 述 4 条 语句 的 程序 段 : 

Pi:a=x+2 

PB:b=y+4 

P:c=at+b 

Pa:d=c+b 

如 果 建 立 对 应 的 4 个 进程 Pi、P。、P;、P,, 可 以 看 出 ,Ps 必须 在 a 和 b 被 赋值 后 方 能 执 
行 ; P, 必须 在 P; 之 后 执行 ; 但 P; 和 P; 的 执行 先后 则 没有 
限制 ,因为 它们 之 间 互 不 依赖 。 因 此 ,在 本 例 中 存在 下 述 的 前 @) 
趋 关系 : PP ,P: 一 Pi,P;-P,, 可 画 出 如 图 3-5 所 示 的 前 一 
趋 图 。 人 ) 

信号 量 机 制 也 可 以 用 来 控制 程序 或 语句 之 间 的 前 趋 关 
系 。 根 据 前 趋 图 ,对 每 一 对 具有 前 趋 关 系 的 进程 ,设置 一 个 公 图 3-5 4 条 语句 的 前 趋 图 


用 的 信号 量 , 并 赋 初 值 为 0, 就 可 在 程序 中 适当 的 地 方 通过 该 信号 量 的 PV 操作 描述 并 控 
制 这 种 前 趋 关系 。 

对 图 3-5 所 示 的 一 组 合作 进程 P, 、P; 、P; 、P, ,为 确保 这 4 个 进程 的 执行 顺序 ,设置 3 个 
同步 信号 量 a 、as 、as ,分 别 表示 Pi 、P; 、Ps 是 否 执 行 完 成 ,其 初 值 均 为 0( 因 为 进程 P, 没 直 
接 后 继 ,也 就 是 说 没有 进程 在 等 待 它 完成 ,所 以 不 需要 设置 a,)。 这 4 个 进程 的 同步 描述 
如 下 : 


semp al = 0; // 信 号 量 ,表示 进程 P 是 否 执行 完成 
semp as = 0; // 信 号 量 ,表示 进程 P 是 否 执行 完成 
semp as = 0; // 信 号 量 ,表示 进程 P 是 否 执行 完成 
Pp,() 
{ 
a=x+2; // 执 行进 程 的 主体 代码 
Va); // 向 直接 后 继 B 发 送信 号 ,表示 进程 执行 完毕 
} 
Pz() 
{ 
b=y+4; // 执 行进 程 的 主体 代码 
V(a); // 向 直接 后 继 P 发 送信 号 ,表示 进程 P 执行 完毕 
} 
P;() 
{ 
Pl(a ); // 等 待 直接 前 趋 P 发 送 已 完成 的 信号 
P(a); // 等 待 直接 前 趋 P 发 送 已 完成 的 信号 
c=atb; // 执 行进 程 的 主体 代码 
V(a); // 向 直接 后 继 P。 发 送信 号 ,表示 进程 P 执行 完毕 
} 
P.() 
{ 
P(a); // 等 待 直接 前 趋 P 发 送 已 完成 的 信号 
d=c+b; // 执 行进 程 的 主体 代码 


@.5 经 典 的 进程 同步 问题 


在 多 道 程序 环境 下 ,进程 同步 问题 十 分 重要 ,也 是 相当 有 趣 的 问题 ,因而 引发 了 不 少 学 
者 对 它 进行 研究 ,由 此 产生 了 一 系列 经 典 的 进程 同步 问题 ,其 中 较 有 代表 性 的 是 “生产 者 - 消 
费 者 问题 “读者 - 写 者 问题 “哲学 家 进餐 问题 "等 。 通过 对 这 些 问 题 的 学 习 和 研究 ,可 以 帮 
助 我 们 更 好 地 理解 进程 同步 概念 及 实现 方法 。 


3.5.1 生产 者 -消费 者 问题 


例 3-8 生产 者 -消费 者 (producer-consumer) 问 题 是 一 个 著名 的 进程 同步 问题 。 它 描 
述 的 是 : 有 一 群生 产 者 进程 (producer(i)) 在 生产 产品 ,并 将 这 些 产 品 提供 给 消费 者 进程 
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(consumer(i)) 去 消费 。 为 使 生产 者 进程 与 消费 者 进 满 
程 能 并 发 执行 ,在 两 者 之 间 设置 了 一 个 具有 个 缓冲 
区 的 环形 缓冲 池 , 如 图 3-6 所 示 。 生 产 者 进程 将 它 所 / 
生产 的 产品 放 入 一 个 个 缓冲 区 中 ; 消费 者 进程 可 从 一 
个 个 缓冲 区 中 取 走 产品 去 消费 。 尽 管 所 有 的 生产 者 | 
进程 和 消费 者 进程 都 是 以 异步 方式 运行 的 ,但 它们 之 
间 必 须 保持 同步 , 即 不 允许 消费 者 进程 到 一 个 空 缓冲 
区 中 取 产 品 ,也 不 允许 生产 者 进程 向 一 个 已 装 满 产 品 
且 尚 未 被 取 走 的 缓冲 区 中 投放 产品 。 图 3-6 环形 缓冲 池 


1. 利用 信号 量 机 制 来 解决 生产 者 -消费 者 问题 





可 利用 一 个 数组 来 表示 上 述 具 及 个 (0,1,…,n 一 1) 缓 冲 区 的 缓冲 池 。 用 输入 指针 in 
来 指示 下 一 个 可 投放 产品 的 缓冲 区 ,每 当 生 产 者 进程 生产 并 投放 一 个 产品 后 ,输入 指针 加 
1。 用 输出 指针 out 来 指示 下 一 个 可 从 中 获取 产品 的 缓冲 区 ,每 当 消 费 者 进程 取 走 一 个 产品 
后 ,输出 指针 加 1。 由 于 这 里 的 缓冲 池 是 循环 缓冲 的 , 故 应 把 输入 指针 加 1 表示 成 in= (in 十 
1) %n, 输 出 指针 加 1 表示 成 out 二 (out 十 1)%n。 当 (in 十 1)%n 二 out 时 表示 缓冲 池 满 ,而 
in 一 out 则 表示 缓冲 池 空 。 

可 利用 互 斥 信号 量 mutex 实现 各 进程 对 缓冲 池 的 互 斥 使 用 ; 利用 信号 量 empty 和 full 
分 别 表示 缓冲 池 中 空 缓冲 区 和 满 缓冲 区 的 数量 。 对 生产 者 -消费 者 问题 的 算法 描述 如 下 : 





int in=0, out=0; // 定 义 和 初 始 化 全 局 变量 
semp empty=n; // 设 置信 号 量 empty, 初 值 为 n 表示 空 缓冲 区 的 数量 
semp full=0; // 设 置信 号 量 full, 初 值 为 0 表示 满 缓 冲 区 的 数量 
semp mutex; // 用 于 缓冲 区 的 互 斥 信号 量 
var buf[n]; // 定 义 一 个 全 局 缓冲 区 
producer(i) // 生 产 者 进程 向 缓冲 区 送 数 
{ 
var nextp; // 定 义 局 部 变量 用 于 存放 每 次 刚 生产 出 来 的 产品 
while (true) 
{ 
生成 新 的 产品 放 入 nextp; 
P(empty); 
P(mutex); 


Buffer[ in] = nextp; 
in= (in+1)%n; 


V(mutex); 
V(fu11); 
} 
} 
consumer (i) // 消 费 者 从 缓冲 区 中 取 走 产品 
{ 
Var nextc; // 定 义 局 部 变量 用 于 存放 每 次 要 消费 的 产品 


while (true) 
{ 
P(ful11); 


P(mutex); 

nextc = buffer[out]; 
out= (out+1)%n; 
V(mutex); 

V(empty); 

处 理 产品 nextc; 


注意 : 在 生产 者 -消费 者 问题 中 ,由 于 同一 过 程 中 包含 几 个 信号 量 ,因此 ,对 P、V 原 语 的 
操作 次 序 要 非常 小 心 。 一 般 来 说 ,由 于 V 原 语 是 释放 资源 的 ,所 以 可 以 以 任意 次 序 出 现 。 
但 P 原 语 则 不 然 ,如 果 次 序 混乱 ,将 会 造成 进程 之 间 的 死 锁 。 


2. 利用 管 程 实现 生产 者 -消费 者 问题 


Monitor ProducerConsumer { 
integer: count, in, out; // 数 据 结 构 定义 
buf: array [0..n—1] of item type; 
condition: full, empty; 
procedure put( item) // 过 程 
{ 
if count > = n then empty. wait; 
buf[ in] = item; 
in: = (in+1) mod n; 
Count++; 
if full. queue then full. signal; 
} 
procedure get( item) 
{ 
if count <= 0 then full. wait; 
item= buf[out]; 
out: = (out +1) mod nj; 
count ——; 
if empty. quence then empty. signal; 
} 
{ in=0; out=0; count=0; } // 初 始 值 
producer() // 生 产 者 进程 
{ 
while (true) 
{ 


produce( item); 
ie 
} 
} 
consumer() // 消 费 者 进程 
{ 


while (true) 
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ProducerConsumer. get( item) ; 


consume( item) ; 


} 

通过 临界 区 互 斥 的 自动 化 , 管 程 比 信号 量 更 能 保证 并 发 编程 的 正确 性 ,但 编译 器 必须 识 
别管 程 并 使 用 某 种 方法 保证 管 程 的 互 斥 执 行 。 

生产 者 -消费 者 问题 是 相互 合作 的 进程 关系 的 一 种 抽象 ,我 们 把 系统 中 使 用 某 一 类 资源 
的 进程 称 为 该 类 资源 的 消费 者 ,而 把 释放 同类 资源 的 进程 称 为 该 类 资源 的 生产 者 。 例 如 ,在 
例 3-4 中 ,采集 进程 是 生产 者 ,计算 进程 是 消费 者 。 因 此 ,生产 者 -消费 者 问题 具有 很 大 的 代 
表 性 和 实用 价值 。 


3.5.2 读者 - 写 者 问题 


例 3-9 一 个 数据 文件 或 记录 可 被 多 个 进程 共享 ,把 只 要 求 读 该 文件 的 进程 称 为 读者 
(Reader) 进 程 , 其 他 进程 则 称 为 写 者 (Writer) 进 程 ,如 图 3-7 所 示 。 人 允许 多 个 进程 同时 读 一 
个 共享 对 象 ,因为 读 操作 不 会 使 数据 文件 混乱 。 但 不 允许 一 个 写 者 进程 和 其 他 读者 进程 或 
写 者 进程 同时 访问 共享 对 象 ,因为 这 种 访问 将 会 引起 混乱 。 所 谓 读者 - 写 者 问题 (Reader- 
Writer Problem) 是 指 保证 一 个 写 者 进程 必须 与 其 他 进程 互 斥 地 访问 共享 对 象 的 同步 问题 。 


R。 | 


















Wi 











图 3-7 读者 - 写 者 问题 


为 实现 读者 与 写 者 进程 间 在 读 或 写 时 的 互 斥 而 设置 了 一 个 互 斥 信号 量 Wmutex。 男 
外 ,再 设置 一 个 整 型 变量 Readcount 表示 正在 读 的 进程 数目 。 由 于 只 要 有 一 个 读者 进程 在 
读 , 便 不 允许 写 者 进程 去 写 。 因 此 , 仅 当 Readcount 二 0, 表 示 尚 无 读者 进程 在 读 时 ,读者 进 
程 才 需 要 执行 PCLWmutex) 操 作 。 若 PC(Wmutex) 操 作成 功 ,读者 进程 便 可 去 读 ,相应 地 ,做 
Readcount 十 1 操作 。 同 理 , 仅 当 读 者 进程 在 执行 了 Readcount 一 1 操作 后 其 值 为 0 时 , 才 须 
执行 VC(Wmutex) 操 作 , 以 便 让 写 者 进程 写 。 又 因为 Readcount 是 一 个 可 被 多 个 读者 进程 
访问 的 临界 资源 ,因此 ,应 该 为 它 设置 一 个 互 斥 信 号 量 Rmutex。 其 算法 描述 如 下 : 


int Readcount =0; // 读 者 进程 的 数目 

semp Wmutex= 1; // 读 者 与 写 者 的 互 斥 信号 量 
semp Rmutex=1; //Readcount 的 互 斥 信号 量 
Reader(i) 


{ 
while (true) 
{ 
P(Rmutex); 
if(Readcount == 0) P(Wmutex); // 第 一 个 进来 的 读者 
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Readcount++ 7 
V(Rmutex); 
读数 据 库 ; 
P(Rmutex); 
Readcount —— ; 


if(Readcount == 0) V(Wmutex); // 最 后 一 个 离开 的 读者 


V(Rmutex); 
} 
} 
Writer (i) 
{ 
while (true) 
{ 
P(Wmutex); 
写 数据 库 ; 
V(Wmutex); 


3.5.3 哲学 家 进餐 问题 


例 3-10 哲学 家 进餐 问题 也 是 一 个 经 典 的 同步 问题 。 该 问题 的 描述 如 下 : 5 位 哲学 家 
围 坐 在 一 张 圆桌 周围 ,桌子 中 间 放 了 一 盘 食 品 , 相 邻 两 位 哲学 家 之 间 有 一 只 和 饶 子 ,如 图 3-8 
所 示 。 哲 学 家 的 生活 包括 两 种 活动 , 即 吃 饭 和 思考 (这 只 是 一 种 抽象 , 即 对 本 问题 而 言 其 他 
活动 都 无 关 紧要 )。 当 一 位 哲学 家 觉得 饿 时 ,他 试图 分 两 次 取 其 左右 最 靠近 他 的 筷子 ,每 次 
拿 一 只 ,但 不 分 次 序 。 如 果 成 功 获 得 两 只 筷子 ,他 就 开始 吃饭 , 吃 完 以 后 放下 和 包子 继续 思考 。 
为 每 一 个 哲学 家 写 一 段 程序 来 描述 其 行为 。 


chopstick[0] 






chopstick[3] 
chopstick[2] 


thinker(2) 
3-8 哲学 家 进餐 问题 


经 分 析 可 知 , 放 在 桌子 上 的 竹子 是 临界 资源 ,在 一 段 时 间 内 只 允许 一 位 哲学 家 使 用 。 为 
了 实现 对 筷子 的 互 斥 使 用 ,可 以 用 一 个 信号 量 表示 一 只 答 子 ,由 这 5 个 信号 量 构成 信号 量 数 
组 。 第 i 位 哲学 家 的 行为 算法 描述 如 下 : 


semp chopstick [4] = {1, 1, 1, 1, 1}; ”// 和 包子 的 互 斥 信 号 量 
thinker(i) 
{ 

P(chopstick[i]); 

P(chopstick[ (i+1) mod 5]); 

进餐 ; 
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V(chopstick[i]); 
V(chopstick[ (i+1) mod 5]); 
思考 ; 
} 
在 以 上 描述 中 , 当 哲学 家 饥 狐 时 ,总 是 先 去 拿 他 右边 的 答 子 , 即 执行 PCchopstick[ 让); 
成 功 后 ,再 去 拿 他 左边 的 筷子 , 即 执行 PCchopstick[ (i 十 1) mod 5]) ,又 成 功 后 便 可 进餐 。 
进餐 毕 ,他 先 放下 右边 的 簧 子 , 然 后 再 放 左边 的 答 子 。 虽 然 , 上 述 解 法 可 保证 不 会 有 两 个 相 
邻 的 哲学 家 同时 进餐 ,但 有 可 能 引起 死 锁 。 假 如 5 位 哲学 家 同时 饥饿 而 各 自 拿 起 右边 的 筷 
子 时 ,就 会 使 5 个 信号 量 chopstick 均 为 0; 当 他 们 再 试图 去 拿 左 边 的 筷子 时 ,都 将 因 无 筷子 
可 拿 而 无 限期 地 等 待 。 对 于 这 样 的 死 锁 问题 ,可 采取 以 下 几 种 解决 方法 : 
(1) 至 多 只 允许 有 4 位 哲学 家 同时 去 拿 右边 的 筷子 ,最 终 能 保证 至 少 有 一 位 哲学 家 能 
够 进餐 ,并 在 用 毕 时 能 释放 出 他 用 过 的 两 只 筷子 ,从 而 使 更 多 的 哲学 家 能 够 进餐 。 
(2) 规定 偶数 号 哲学 家 先 拿 他 右边 的 筷子 ,再 拿 左 边 的 筷子 ; 而 奇数 号 哲学 家 则 相反 。 
按 此 规定 ,将 是 1、2 号 哲学 家 竞争 2 号 镜子 ,3、4 号 哲学 家 竞争 4 号 答 子 。 即 ,5 位 哲学 家 都 
先 竞争 偶数 号 筷子 ,获得 后 ,再 去 竞争 奇数 号 筷子 ,最 后 总 会 有 一 位 哲学 家 能 获得 两 只 筷子 
而 进餐 (读者 可 自己 写 出 其 算法 ) 。 
信号 量 机 制 是 一 种 有 效 的 进程 同步 工具 。 在 长 期 而 广泛 的 应 用 中 ,信号 量 机 制 又 得 到 
了 很 大 的 发 展 。 例 如 ,对 上 述 问 题 除 了 利用 前 面 介绍 的 整 型 信号 量 机 制 解决 以 外 ,也 可 采用 
记录 型 信号 量 或 信号 量 集 等 机 制 解决 。 有 兴趣 的 读者 可 进一步 查阅 相关 的 资料 。 


@.6 进程 通信 


并 发 执行 的 进程 为 了 协调 一 致 地 完成 指定 的 任务 ,进程 之 间 要 有 一 定 的 联系 ,这 种 联系 
通常 采用 进程 间 交 换 数据 (或 信息 ) 的 方式 进行 ,我 们 将 这 种 方式 称 为 进程 的 通信 。 


3.6.1 进程 通信 的 类 型 


进程 通信 交换 的 数据 量 可 多 可 少 ,在 操作 系统 中 将 数据 交换 量 少 的 进程 协调 过 程 称 为 
低级 通信 ,而 将 交换 信息 量 较 大 的 过 程 称 为 高 级 通信 (也 称 消息 通信 )。 

低级 通信 由 于 数据 量 小 ,通常 交换 的 是 控制 信息 ,一 般 传 递 一 个 或 几 个 字 节 的 信息 ,有 
时 仅仅 为 一 个 状态 ,标志 或 数值 ,它们 常 采 用 变量 、 数 组 等 方式 实现 。 进 程 间 的 互 斥 与 同步 ， 
由 于 其 所 交换 的 信息 量 少 而 被 归 和 人 低级 通信 ,进程 通过 修改 信号 量 来 向 其 他 进程 表明 该 资 
源 是 否 可 用 。 应 当 指出 ,信号 量 机 制作 为 同步 工具 是 有 效 的 ,但 作为 通信 工具 却 不 够 理想 ， 
这 是 因为 共享 数据 结构 的 设置 .数据 的 传送 .进程 的 互 斥 与 同步 都 必须 由 程序 员 实现 。 这 不 
仅 增加 了 程序 设计 的 复杂 性 ,也 给 程序 理解 带 来 困难 , 且 P、V 操作 易 导致 死 锁 。 

高 级 通信 由 于 交换 的 信息 数据 量 大 ,进程 间 可 采用 缓冲 、 信 箱 、 管 道 和 共享 区 等 方式 实 
现 。 这 种 大 量 的 传递 促进 了 本 地 进程 间 的 通信 和 远程 进程 间 的 通信 的 开发 ,从 而 为 远程 终 
端 操作 和 计算 机 网 络 的 开发 和 控制 莫 定 了 基础 。 本 节 重 点 讨论 高 级 通信 。 








3.6.2 进程 通信 的 方式 


根据 通信 实施 的 方式 和 数据 存 取 的 方式 ,进程 通信 方式 可 归结 为 共享 存储 器 方式 、 消 息 
缓冲 方式 和 管道 通信 方式 。 随 着 网 络 的 发 展 ,进程 间 通 信 出 现 了 套 接 字 、 远 程 调用 等 方法 ， 
相关 内 容 可 以 参考 计算 机 网 络 教 材 。 


1. 共享 存储 器 


共享 存储 器 方式 的 通信 基础 是 共享 数据 结构 或 共享 存储 区 ,进程 之 间 能 够 通过 这 些 空 
间 进 行 通信 。 数 据 结构 是 系统 为 保证 进程 正常 运行 而 设置 的 专门 机 制 ,利用 某 个 专门 的 数 
据 结 构 存 放 进程 间 需 交换 的 数据 , 它 可 以 指定 为 一 个 寄存 器 ,一 组 寄存 器 ,一 个 数组 ,一 个 链 
表 、 一 个 记录 等 。 例 如 ,可 以 在 每 个 进程 的 PCB 表 中 增加 一 个 表 项 来 存放 通信 信息 ,进程 由 
通信 表 项 中 取得 交换 数据 。 共 享 存储 区 是 在 主 存 中 设置 一 个 专门 的 区 域 ,进程 像 生产 者 和 
消费 者 一 样 共用 这 个 存储 区 送 数 和 取 数 。 这 里 ,公用 数据 结构 的 设置 及 对 进程 间 同 步 的 处 
理 都 是 程序 员 的 职责 ,这 无 疑 增加 了 程序 员 的 负担 ,而 操作 系统 却 只 须 提 供 共享 存储 器 。 
此 ,这 种 通信 方式 是 低 效 的 ,只 适 于 传递 少量 的 数据 。 


2. 消息 缓冲 


不 论 是 单机 系统 、 多 机 系统 还 是 计算 机 网 络 ,消息 缓冲 机 制 都 是 应 用 最 广泛 的 一 种 进程 
间 通 信 的 机 制 。 在 消息 缓冲 系统 中 ,进程 间 的 数据 交换 是 以 格式 化 的 消息 (message) 为 单 
位 的 ; 在 计算 机 网 络 中 ,又 把 message 称 为 报 文 。 程 序 员 直接 利用 系统 提供 的 一 组 通信 命 
令 进行 通信 。 操 作 系统 隐藏 了 通信 的 实现 细节 ,大 大 降低 了 通信 程序 编制 的 复杂 性 ,因而 使 
消息 缓冲 方式 获得 广泛 的 应 用 。 消 息 传 递 系统 的 通信 方式 属于 高 级 通信 方式 。 又 因 其 实现 
方式 的 不 同 而 进一步 分 成 直接 通信 方式 和 间接 通信 方式 两 种 。 


3. 管道 通信 


所 谓 管道 ,是 指 用 于 连接 一 个 读 进 程 和 一 个 写 进程 以 实现 它们 之 间 通 信 的 一 个 共享 文 
件 , 又 名 管道 文件 。 向 管道 (共享 文件 ) 提 供 输入 的 发 送 进程 ( 即 写 进程 ) 以 字符 流 形式 将 大 
量 的 数据 送 入 管道 ,而 接收 管道 输出 的 接收 进程 ( 即 读 进程 ) 则 从 管道 中 接收 ( 即 读 ) 数 据 。 
由 于 发 送 进程 和 接收 进程 是 利用 管道 进行 通信 的 , 故 又 称 为 管道 通信 。 这 种 方式 首创 于 
UNIX 系统 ,由 于 它 能 有 效 地 传送 大 量 数据 ,因而 又 被 引入 到 许多 其 他 操作 系统 中 。 

为 了 协调 双方 的 通信 ,管道 机 制 必须 提供 以 下 3 方面 的 协调 能 力 : 

(1) 互 斥 , 即 当 一 个 进程 正在 对 管道 执行 读 / 写 操作 时 ,其 他 ( 另 一 ) 进 程 必须 等 待 。 

(2) 同步 , 指 当 写 (输入 ) 进 程 把 一 定数 量 ( 如 4KB) 的 数据 写 和 管道, 便 去 睡眠 等 待 , 直 
到 读 ( 输 出 ) 进 程 取 走 数据 后 ,再 把 它 唤 醒 。 当 读 进程 读 一 个 空 管道 时 ,也 应 睡眠 等 待 ,直至 
写 进程 将 数据 写 人 管道 后 , 才 将 之 唤醒 。 

(3) 确定 对 方 是 否 存在 ,只 有 确定 了 对 方 已 存在 时 ,才能 进行 通信 。 


3.6.3 消息 缓冲 队列 通信 机 制 
消息 缓冲 队列 通信 机 制 首先 由 美国 的 Hansan 提出 ,并 在 RC 4000 系统 上 实现 ,后 来 被 
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广泛 应 用 于 本 地 进程 之 间 的 通信 中 。 操 作 系统 将 一 组 数据 称 为 一 个 消息 ,并 在 系统 中 设立 

一 个 大 的 缓冲 区 ,作为 消息 缓冲 池 ,缓冲 池 分 成 一 个 个 的 消息 缓冲 区 ,每 个 缓冲 区 中 存放 一 
个 消息 。 进 程 通信 时 ,首先 向 系统 申请 一 个 缓冲 区 , 放 入 自己 的 消息 ,并 通知 接收 进程 。 接 
收 进程 从 缓冲 区 中 取 走 消息 ,同时 释放 缓冲 区 交 回 系统 。 消 息 通信 通常 采用 一 对 系统 调用 ， 
即 Send( 发 送 ) 过 程 和 Receive( 接 收 ) 过 程 来 实现 。 


1. 消息 缓冲 队列 通信 机 制 中 的 数据 结构 


1) 消息 缓冲 区 
在 消息 缓冲 队列 通信 方式 中 ,主要 利用 的 数据 结构 是 消息 缓冲 区 , 它 是 一 个 记录 结构 ， 
主要 包含 下 列 内 容 : 


Sender; // 发 送 者 进程 标识 符 

size; // 消 息 长 度 

text; // 消 息 正文 

next; // 指 向 下 一 个 消息 缓冲 区 的 指针 


2) PCB 中 有 关 通 信和 的 数据 项 

在 利用 消息 缓冲 队列 通信 机 制 时 ,在 设置 消息 缓冲 队列 的 同时 ,还 应 增加 用 于 对 消息 队 
列 进行 操作 和 实现 同步 的 信号 量 , 并 将 它们 置 入 进程 的 PCB 中 。 在 PCB 中 应 增加 的 数据 
项 可 描述 如 下 : 


mq; // 消 息 队列 队 首 指针 

mutex; // 消 息 队列 互 斥 信号 量 , 初 值 为 1 

sm; // 消 息 队列 资源 信号 量 , 用 于 进程 的 消息 计数 , 初 值 为 0 
2. 发 送 过 程 


发 送 进程 在 调用 发 送 过 程 发 送 消息 之 前 ,应 先 在 自己 的 内 存 空间 设置 一 个 发 送 区 a, 如 
图 3-9 所 示 ,把 待 发 送 的 消息 正文 ,发送 进程 标识 符 、 消 息 长 度 等 信息 填 和 人 其 中 ,然后 调用 发 
送 过 程 ,把 消息 发 送 给 目标 (接收 ?进程 。 发 送 过 程 首先 根据 发 送 区 a 中 所 设置 的 消息 长 度 
a. size 从 缓冲 池 中 申请 一 个 缓冲 区 i, 接 着 ,把 发 送 区 a 中 的 信息 复制 到 缓冲 区 ii 中。 为 了 能 
将 i 挂 在 接收 进程 的 消息 队列 mq 上 ,应 先 获得 接收 进程 内 部 标识 符 j, 然 后 将 i 挂 在 j. mq 
上 。 由 于 该 队列 属于 临界 资源 , 故 在 执行 insert 操作 的 前 后 都 要 执行 PV 操作 。 
发 送 过 程 可 描述 如 下 : 
send(receiver, a) 
| getbuf (a. size, i); // 根 据 a. size 申请 缓冲 区 
i. sender = a. sender; // 将 发 送 区 a 中 的 信息 复制 到 消息 缓冲 区 中 
i. text =a. text; 


i.next = 0; 
getid(PCB set, receiver, j) // 获 得 接收 进程 内 部 标识 符 j 
P(j. mutex); 
insert(j. mp, i); // 将 消息 缓冲 区 插入 消息 队列 
V(j. mutex); 


V(j. sm); // 通 知 接收 进程 
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图 3-9 采用 消息 缓冲 队列 通信 机 制 的 消息 接收 和 发 送 过 程 


3. 接收 过 程 


接收 进程 调用 接收 过 程 receive(b) 从 自己 的 消息 缓冲 队列 mq 中 摘 下 第 一 个 消息 缓冲 
区 i, 并 将 其 中 的 数据 复制 到 以 b 为 首 址 的 指定 消息 接收 区 。 接 收 过 程 描述 如 下 : 


receive(b) 
{ 
j= getid(); // 获 得 接收 进程 内 部 标识 符 j 
P(j. sm); 
P(j. mutex); 
remove(j. mq, i); // 将 消息 队列 中 的 第 一 个 消息 移出 


V(j. mutex); 

b. sender = i. sender; // 将 消息 缓冲 区 i 中 的 信息 复制 到 接收 区 b 
b. size= i. size; 

b. text = i. text; 

releasebuf (1); // 将 消息 缓冲 区 i 释放 


J 


3.6.4 


信箱 通信 


进程 通信 也 可 以 采用 信箱 通信 (mailbox) 的 方式 。 信 箱 是 一 种 大 小 固定 的 私有 数据 结 


构 , 它 不 像 缓冲 





区 那样 被 系统 内 所 有 进程 共享 。 它 由 信箱 头 和 若干 信箱 体 组 成 。 其 中 ,信箱 


头 描述 信箱 名 称 、 大 小 、 方 向 以 及 拥有 该 信箱 的 进程 名 等 ,信箱 体 主要 用 来 存放 消息 。 图 3-10 
为 信箱 通信 结构 。 

当 进 程 A 希望 与 进程 马 通 信 时 ,由 进程 A 创建 一 个 连接 两 个 进程 的 信箱 。 在 以 后 的 通信 
中 ,进程 A 将 调用 发 送 过 程 将 信件 投入 信箱 ,系统 保证 进程 B 可 在 任何 时 候 调用 接收 过 程 取 
走 信件 而 不 丢失 。 因 此 ,利用 信箱 通信 方式 , 既 可 以 实现 实时 通信 ,也 可 以 实现 非 实时 通信 。 
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发 送 信箱 头 
发 送 | 
[| | tnt 


图 3-10 ”信箱 通信 结构 




















人 7 线程 


20 世纪 80 年 代 中 期 ,人 们 提出 了 比 进程 更 小 的 能 独立 运行 的 基本 单位 
用 它 来 提高 系统 内 并 发 执行 的 程度 ,进一步 提高 系统 的 吞吐 量 。 


3.7.1 线程 的 引入 


许多 实际 应用) 系统, 如 事务 处 理 软件 ,数据库 处 理 软件 .窗口 系统 以 及 操作 系统 本 身 
等 ,经 常 需要 同时 处 理 多 个 服务 请 求 ,而 且 对 这 些 服务 请 求 的 处 理 不 仅 运 行 的 是 同一 服务 程 
序 ,更 是 针对 同一 地 址 空间 (同一 数据 区 ) 的 。 例 如 ,航空 公司 售票 系统 需要 同时 处 理 来 自 多 
个 售票 窗口 的 购 票 或 查询 请 求 ,对 这 些 购 票 或 查询 请 求 的 处 理 都 是 对 同样 的 数据 一 一 飞机 
座位 和 售 出 信息 ?进行 的 (可 能 针对 同一 航班 或 不 同 航班 )。 又 如 ,数据 库 服 务 器 软件 需要 同 
时 处 理 来 自 多 个 客户 机 的 数据 查询 请 求 , 这 些 请 求 都 是 针对 同一 数据 库 的 。 再 如 ,操作 系统 
需要 同时 处 理 来 自 多 个 用 户 进程 的 读 盘 请 求 , 这 些 请 求 都 针对 同一 个 盘 , 对 这 些 请 求 的 处 理 
都 是 基于 同一 磁盘 缓冲 区 。 对 于 以 上 这 种 “基于 同一 数据 区 同时 多 个 请 求 " 的 情况 ,用 进程 
模型 来 实现 时 ,显然 只 有 3 种 办 法 : 

(1) 用 一 个 进程 顺序 处 理 所 有 请 求 , 当 该 进程 正在 处 理 一 个 购 票 请 求 时 (即使 该 进程 正 
在 因为 处 理 该 请 求 而 处 于 等 待 磁盘 服务 期 间 , 也 就 是 说 ,不 管 该 进程 是 在 忙 时 还 是 在 等 时 )， 
其 他 购 票 请 求 只 能 等 待 。 例 如 ,在 航空 公司 售票 系统 中 ,用 一 个 进程 来 处 理 来 自 所 有 售票 窗 
口 的 所 有 购 票 请 求 。 显 然 ,这 种 方案 会 导致 较 多 的 等 待 ( 较 长 的 等 待 队列 ) 和 较 慢 的 响应 时 
间 。 其 中 关键 的 效率 问题 是 , 当 该 进程 因 处 理 当前 请 求 而 需要 等 待 磁盘 服务 (或 其 他 资源 ) 
时 ,即使 还 有 其 他 请 求 要 处 理 , 该 进程 也 进入 等 待 态 , 这 样 就 出 现 了 一 方面 有 很 多 请 求 等 待 
处 理 , 另 一 方面 该 服务 进程 却 处 于 等 待 态 的 矛盾 和 时 间 浪 费 局 面 。 

(2) 用 多 个 相互 独立 的 进程 ,每 个 进程 负责 处 理 一 个 购 票 请 求 。 这 种 方案 不 会 出 现 上 
述 的 矛盾 和 时 间 浪 费 局 面 , 但 显然 ,这 些 进 程 间 需 要 大 量 的 和 复杂 的 共享 机 制 ,而 且 需 要 大 
量 的 进程 ,每 个 进程 都 需要 占用 一 套 完整 的 进程 管理 信息 ,这 些 进程 频繁 地 动态 建立 和 撤 
销 , 频 繁 地 进行 进程 切换 。 这 些 开 销 是 很 大 的 ,而 考虑 到 这 些 进程 处 理 的 大 部 分 数据 是 共享 
的 ,运行 的 程序 也 是 同一 个 程序 ,这 种 开销 就 更 值得 研究 了 。 

(3) 用 一 个 进程 来 并 发 处 理 所 有 请 求 , 只 要 还 有 其 他 请 求 要 处 理 , 该 进程 就 不 进入 等 待 
态 。 例 如 , 当 该 进程 因 处 理 当 前 请 求 而 需要 等 待 磁盘 服务 时 ,该 进程 记录 当前 请 求 的 当前 处 
理 状态 ,然后 转 去 处 理 下 一 请 求 ; 而 当前 一 请 求 所 等 待 的 磁盘 服务 完成 时 ,该 进程 需 在 适当 
的 时 间 继 续 为 前 一 请 求 服务 。 显 然 ,在 这 种 方案 下 ,该 进程 需要 记录 所 有 请 求 的 处 理 状态 ， 
并 在 这 些 请 求 间 进行 切换 和 轮换 服务 (整个 进程 的 操作 类 似 于 一 个 有 限 状 态 机 : 根据 发 生 





线程 ,试图 


的 事件 作出 相应 的 反应 )。 这 加 重 了 该 进程 的 负担 和 复杂 性 。 而 实际 上 ,这 种 管理 负担 是 一 
种 与 应 用 无 关 的 共性 的 需要 ,不 应 由 每 个 用 户 进程 来 承担 ,而 应 考虑 由 操作 系统 和 一 个 公用 
函数 库 来 统一 实现 。 

从 上 述 分 析 可 以 看 出 ,以 上 3 种 办 法 都 不 能 很 好 地 解决 和 实现 “基于 同一 数据 区 同时 处 
理 多 个 请 求 ” 的 需要 。 因 而 ,有 不 少 研究 操作 系统 的 学 者 想到 , 若 能 将 进程 作为 拥有 资源 的 
基本 单位 ,不 作为 调度 的 基本 单位 ,不 对 之 进行 频繁 的 切换 ,从 而 减少 程序 并 发 执行 时 系统 
所 付出 的 时 空 开 销 , 就 能 够 提高 进程 执行 的 并 发 程度 ,提高 资源 的 利用 率 和 系统 的 吞吐 量 。 
正 是 在 这 种 思想 的 指导 下 ,形成 了 线程 的 概念 。 


3.7.2 线程 的 概念 


一 个 进程 内 的 基本 调度 单位 称 为 线程 或 轻 权 进程 ,这 个 调度 单位 既 可 由 操作 系统 的 内 
核 控 制 , 也 可 由 用 户 程序 控制 。 在 引入 多 线程 的 操作 系统 中 ,进程 和 线程 具有 如 下 的 区 别 和 
联系 : 

(1) 进程 作为 系统 资源 分 配 的 基本 单位 ,与 进程 有 关 的 资源 信息 都 被 记录 在 进程 控制 
块 PCB 中 ,以 表示 该 进程 拥有 这 些 资源 或 正在 使 用 它们 。 在 任 一 进程 中 所 拥有 的 资源 包括 
受到 保护 的 进程 地 址 空间 、 用 于 实现 进程 间 和 线程 间 同 步 和 通信 的 机 制 . 已 打开 的 文件 和 已 
申请 到 的 I/O 设备 ,以 及 一 张 由 系统 核心 维护 的 地 址 映射 表 , 该 表 用 于 实现 用 户 的 程序 的 
迪 辑 地 址 到 其 物理 地 址 的 映射 。 线 程 中 的 实体 基本 上 不 拥有 系统 资源 ,只 有 一 点 必 不 可 少 
的 、 能 保证 独立 运行 的 资源 。 例 如 ,在 每 个 线程 中 都 应 具有 一 个 用 于 控制 线程 运行 的 线程 控 
制 块 (Thread Control Block,TCB) ,用 于 指示 被 执行 指令 的 程序 计数 器 ,以 及 保留 局 部 变 
量 \、 少 数 状态 参数 和 返回 地 址 的 一 组 寄存 器 和 堆栈 。 

(2) 进程 不 再 是 一 个 独立 运行 的 基本 单位 ,而 是 将 线程 作为 一 个 独立 运行 的 基本 单位 。 
由 于 线程 很 “ 轻 ”, 相 对 于 进程 切换 ,线程 的 切换 非常 迅速 且 开 销 小 。 而 且 进 程 的 调度 与 切换 
都 是 由 操作 系统 内 核 完 成 的 ,而 线程 既 可 由 操作 系统 内 核 完 成 ,也 可 由 用 户 程序 完成 。 

(3) 一 个 系统 中 可 以 有 多 个 进程 ,一 个 进程 可 以 有 一 个 或 多 个 线程 (至 少 有 一 个 ) 。 系 
统 中 的 所 有 线程 都 只 能 属于 某 一 特定 的 进程 。 这 些 线程 都 能 并 发 执行 ,但 只 有 在 多 处 理 机 
系统 中 它们 才能 真正 地 并 行 运行 。 

(4) 在 同一 进程 中 的 各 个 线程 都 可 以 共享 该 进程 所 拥有 的 资源 。 由 于 同一 进程 的 所 有 
线程 都 具有 相同 的 地 址 空间 (同一 进程 的 地 址 空间 ) ,所 以 ,每 个 线程 都 可 访问 每 个 虚 地 址 ， 
一 个 线程 可 以 读 、 写 甚至 完全 破坏 另 一 个 线程 的 堆栈 。 线 程 之 间 没 有 保护 ,因为 不 可 能 也 不 
必要 。 不 同 的 进程 可 能 来 自 不 同 的 可 能 相互 敌对 的 用 户 , 而 某 个 进程 总 是 由 一 个 特定 的 用 
户 所 有 , 它 创 建 多 个 线程 只 是 为 了 协作 ,而 不 是 为 了 冲突 。 除 了 共享 地 址 空间 外 ,所 有 的 线 
程 还 共享 同一 组 打开 的 文件 、 子 进程 .定时 器 \ 信 号 等 。 

(5) 与 传统 的 进程 类 似 , 线 程 可 以 创建 子 线程 ,在 各 线程 之 间 也 存在 着 共享 资源 和 相互 
合作 的 制约 关系 ,致使 线程 运行 时 也 具有 3 种 基本 的 状态 : 运行 .阻塞 就绪。 

多 线程 系统 中 ,进程 与 线程 的 关系 如 图 3-11 所 示 。 
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图 3-11 线程 与 进程 的 关系 


3.7.3 线程 的 控制 


线程 的 控制 通常 以 线程 包 的 形式 体现 ,一 组 供用 户 使 用 的 与 线程 有 关 的 原 语 ( 即 系统 调 
用 ) 称 为 一 个 线程 包 。 


1. 线程 的 建立 与 撤销 


在 多 线程 操作 系统 环境 下 ,应 用 程序 在 启动 时 通常 仅 有 一 个 线程 在 执行 ,该 线程 称 为 初 
始 化 线程 。 它 可 根据 需要 再 去 创建 若干 个 线程 。 在 创建 新 线程 时 要 利用 线程 创建 函数 (或 
系统 调用 ) ,并 提供 相应 的 参数 ,如 指向 线程 主 程序 的 入 口 指针 、 堆 栈 的 大 小 以 及 用 于 调度 的 
优先 级 等 。 在 线程 创建 函数 执行 完 后 ,将 返回 一 个 线程 标识 符 供 以 后 使 用 。 

与 进程 类 似 , 线 程 可 有 两 种 终止 方式 : 因 完 成 任务 而 自行 终止 ,或 被 外 界 强行 终止 。 但 
有 些 线 程 (主要 是 系统 线程 ) 一 旦 建立 便 一 直 运 行 下 去 而 不 再 被 终止 。 


2. 线程 调度 


线程 调度 算法 和 进程 调度 算法 是 类 似 的 ,例如 优先 级 、 轮 转 、 多 重 队 列 调度 算法 等 。 和 
进程 模型 一 样 ,线程 包 也 提供 相应 的 界面 ,允许 用 户 选 择 调度 算法 和 设置 优先 级 。 


3. 进程 全 局 变量 和 线程 (私有 ) 全 局 变量 


线程 不 仅 有 自己 的 栈 和 程序 计数 器 ,有 时 还 需要 有 少量 的 私有 数据 。 这样, 在 多 线程 系 
统 中 ,一 个 进程 中 的 所 有 变量 便 分 为 3 类 : 进程 全 局 变量 (对 该 进程 中 的 所 有 线程 中 的 所 有 
过 程 可 见 ) ,线程 (私有 ) 全 局 变量 (对 该 线程 中 的 所 有 过 程 可 见 )、 过 程 局 部 变量 (只 对 该 过 程 
可 见 )。 由 于 目前 的 程序 设计 语言 只 支持 进程 全 局 变量 和 过 程 局 部 变量 ,更 确切 地 说 ,目前 
的 语言 只 支持 全 局 变量 (对 整个 程序 而 言 ) 和 局 部 变量 (对 一 个 过 程 而 言 ) ,而 并 不 对 全 局 变 
量 作 更 细 的 划分 ,因此 ,对 线程 (私有 ) 全 局 变量 ,需要 将 线程 (私有 ) 全 局 变量 数据 区 的 地 址 
作为 一 个 额外 的 参数 传递 给 该 线程 中 的 每 个 过 程 。 


4. 线程 互 斥 与 同步 
由 于 同一 进程 内 的 各 线程 共享 该 进程 的 所 有 资源 和 地 址 空间 ,任何 线程 对 资源 的 操作 


都 会 对 其 他 相关 线程 带 来 影响 。 因 此 ,系统 必须 为 线程 的 执行 提供 同步 控制 机 构 。 线 程 中 
所 使 用 的 同步 控制 机 构 与 进程 中 所 使 用 的 相同 。 


3.7.4 线程 的 实现 


对 于 线程 管理 有 两 种 方式 : 一 种 是 由 操作 系统 来 管理 线程 , 男 一 种 是 由 进程 自己 来 管 
理 线程 。 因 此 ,线程 的 实现 就 有 两 种 方式 : 用 户 态 线程 和 核心 态 线程 。 在 同一 个 操作 系统 
中 ,有 的 使 用 纯 用 户 态 线程 ,有 的 使 用 纯 核 心态 线程 有 的 则 混合 使 用 这 两 种 方式 。 


1. 用 户 态 线程 


这 种 方式 将 线程 包 完 全 放 在 用 户 空间 内 ,而 核心 对 此 一 无 所 知 。 就 核心 而 言 , 它 只 是 在 
管理 常规 的 进程 一 一 即 单线 程 进程 。 线 程 在 一 个 线程 运行 管理 系统 上 执行 ,而 线程 运行 管 
理 系 统 则 是 一 组 管理 线程 的 过 程 。 当 线程 执行 系统 调用 、 转 入 睡眠 、 实 施 一 个 信号 量 或 互 
斥 量 操 作 或 其 他 可 能 导致 它 被 挂 起 的 操作 时 ,都 调用 线程 运行 管理 系统 中 的 过 程 ,这 个 
过 程 检查 线程 是 否 必须 被 阻塞 。 若 是 , 它 将 线程 的 寄存 器 存 人 表 中 ,寻找 一 个 未 被 阻塞 
的 线程 来 运行 ,并 为 新 线程 装配 寄存 器 。 一 旦 堆栈 指针 和 程序 计数 器 被 切换 ,新 线程 就 
立即 被 激活 了 。 如 果 计 算 机 有 存储 所 有 寄存 器 及 恢复 所 有 寄存 器 的 指令 , 则 整个 线程 切 
换 工 作用 几 条 指令 就 可 以 完成 。 即 ,线程 在 切换 时 只 进行 线程 执行 环境 的 切换 ,不 进行 
处 理 机 的 切换 。 


2. 核心 态 线程 





这 种 方式 下 ,用 户 级 的 线程 运行 管理 系统 已 不 再 需要 了 。 核 心 为 每 个 进程 准备 了 一 张 
表 , 每 个 线程 占 一 项 ,填写 有 关 的 寄存 器 、 状 态 、 优 先 级 和 其 他 信息 。 这 些 信息 与 用 户 态 线程 
是 一 样 的 ,只 是 现在 放 在 核心 空间 。 所 有 对 线程 的 操作 都 以 系统 调用 的 形式 实现 。 当 线程 
被 阻塞 时 ,操作 系统 不 仅 可 以 运行 同一 进程 中 的 另 一 线程 ,而 且 可 以 运行 别 的 进程 中 的 线 
程 。 相 比 之 下 ,用户 级 的 线程 运行 管理 系统 总 是 在 运行 本 进程 中 的 线程 ,除非 操作 系统 核心 
取消 其 CPU 使 用 权 ( 或 已 经 没有 就 绪 的 线程 供 运行 了 ) 。 


3. 对 用 户 态 线程 和 核心 态 线程 的 评价 


1) 用 户 态 线程 的 优点 和 核心 态 线程 的 缺点 

(1) 用 户 态 线程 最 明显 的 优点 是 它 可 以 在 一 个 不 支持 线程 的 操作 系统 上 实现 。 例 如 ， 
UNIX 并 不 支持 线程 ,但 已 有 了 多 个 基于 UNIX 的 用 户 态 线程 包 。 

(2) 开销 和 性 能 。 用 户 态 线程 切换 比 陷入 核心 至 少 快 一 个 数量 级 ,这 也 就 是 用 户 态 线 
程 的 受 欢迎 之 处 。 而 核心 态 线程 中 ,由 于 所 有 线程 操作 都 以 系统 调用 的 形式 实现 ,从 而 比 在 
用 户 级 调用 线程 运行 管理 系统 中 的 过 程 开销 大 得 多 。 

(3) 用 户 态 线程 允许 每 个 进程 有 自己 特 设 的 调度 算法 。 对 有 些 应 用 ,如 配 有 一 个 空闲 
区 回收 线程 的 应 用 ,有 了 自己 的 调度 算法 ,就 不 必 担 忧 一 个 线程 会 在 一 些 不 适当 的 地 方 停 
不 沪 % 

(4) 用 户 态 线程 的 可 扩充 性 也 很 好 。 而 核心 线程 需要 不 停 地 使 用 核心 空间 ,这 在 线程 
数 较 多 时 是 一 个 问题 。 
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2) 用 户 态 线程 的 缺点 和 核心 态 线程 的 优点 

用 户 态 线程 虽然 有 较 好 的 性 能 ,但 也 有 一 些 较 大 的 问题 。 

(1) 在 用 户 态 线程 中 ,阻塞 型 系统 调用 会 阻塞 所 有 的 线程 。 例 如 ,线程 在 读 一 条 空 的 管 
道 时 ,会 导致 所 在 进程 阻塞 ,这 意味 着 该 进程 的 所 有 线程 (包括 本 线程 ) 都 被 阻塞 。 而 在 核心 
实现 中 ,同样 情况 发 生 时 线程 陷入 内 核 ,内 核 将 线程 挂 起 ,并 开始 运行 男 一 个 线程 。 

(2) 在 用 户 态 线程 中 ,在 一 个 线程 开始 运行 以 后 ,除非 它 自愿 放弃 CPU, 和 否则 没有 其 他 
线程 能 得 到 运行 。 而 在 核心 级 线程 中 ,周期 发 生 的 时 钟 中 断 可 以 解决 这 个 问题 。 在 用 户 态 
线程 实现 中 , 单 进程 中 没有 时 钟 中 断 ,从 而 轮转 式 的 调度 是 行 不 通 的 。 

3) 用 户 态 线程 和 核心 态 线程 都 存在 的 问题 

典型 的 问题 是 ,由 于 一 个 进程 内 的 所 有 线程 共享 该 进程 的 所 有 数据 区 和 信号 等 资源 , 因 
此 随机 的 线程 切换 会 导致 数据 的 覆盖 ,不一致 等 错误 ,导致 资源 使 用 的 冲突 ,导致 很 多 库 程 
序 变 成 不 可 再 人 代码 。 


3.7.5 线程 的 适用 范围 


使 用 线程 最 大 的 好 处 是 在 有 多 个 任务 需要 处 理 机 处 理 时 能 减少 处 理 机 的 切换 时 间 。 线 
程 的 几 种 典型 的 应 用 如 下 : 

(1) 服务 器 中 的 文件 管理 或 通信 控制 。 局 域 网 的 文件 服务 器 (进程 ) 由 于 等 待 盘 操作 而 
经 常 被 阻塞 。 若 对 文件 的 访问 要 求 由 服务 器 进程 派生 出 的 线程 进行 处 理 , 则 第 一 个 线程 睡眠 
时 另 一 个 线程 可 以 继续 运行 (接受 新 的 文件 服务 请 求 )。 这 样 的 好 处 是 文件 服务 的 春 吐 率 和 性 
能 都 提高 了 。 如 果 计 算 机 系统 是 多 处 理 机 的 ,这 些 线程 还 可 以 被 安排 到 不 同 的 处 理 机 上 执行 。 

(2) 线程 也 经 常用 于 客户 线程 。 例 如 ,一 个 客户 想 要 在 多 个 服务 器 上 备份 一 个 文件 ,就 
可 以 用 一 个 线程 与 一 个 服务 器 对 话 。 客 户 线程 的 男 一 种 用 途 是 处 理 信号 ,如 Del、Break 等 
键盘 中 断 。 这 时 ,不 再 让 信号 中 断 进程 ,而 是 专门 安排 一 个 线程 来 等 待 中 断 。 通 常 它 是 被 阻 
塞 的 , 当 信号 产生 时 , 它 被 唤醒 并 处 理 该 信号 。 因 此 ,用 了 线程 后 可 以 消除 用 户 级 的 中 断 。 

(3) 前 后 台 处 理 。 许 多 用 户 都 有 过 前 后 台 处 理 经 验 , 即 把 一 个 计算 量 较 大 的 程序 或 实 
时 性 要 求 不 高 的 程序 安排 在 处 理 机 空闲 时 执行 。 对 于 同一 个 进程 中 的 上 述 程序 来 说 ,线程 
可 用 来 减少 处 理 机 切换 时 间 和 提高 执行 速度 ,例如 ,在 表 处 理 进 程 中 ,一 个 线程 可 用 来 显示 
菜单 和 读 取 用 户 输入 ,而 另 一 个 线程 则 可 用 来 执行 用 户 命令 和 修改 表格 。 由 于 用 户 输入 命 
令 和 命令 执行 分 别 由 不 同 的 线程 在 前 后 台 执行 ,从 而 提高 了 操作 系统 的 效率 。 

(4) 数据 的 批 处 理 以 及 网 络 系统 中 的 信息 发 送 与 接收 和 其 他 相关 处 理 等 。 例 如 ， 
图 3-12 给 出 了 一 个 用 户主 机 通过 网 络 向 两 台 远 程 服务 器 进行 远程 调用 (RPC) 以 获得 相应 
结果 的 执行 情况 。 如 果 用 户 程 序 只 用 一 个 线程 , 则 第 二 个 远程 调用 的 请 求 只 有 在 得 到 第 一 
个 请 求 的 执行 结果 后 才能 发 出 ,如 图 3-12(a) 所 示 。 采 用 多 线程 时 ,用 户 程序 不 必 等 待 第 一 
个 RPC 请 求 的 执行 结果 而 直接 发 出 第 二 个 RPC 请 求 ,如 图 3-12(b) 所 示 , 从 而 缩短 了 等 待 
时 间 。 

由 此 ,我 们 知道 ,最 适合 线程 的 系统 是 多 处 理 机 系统 。 但 是 ,并 不 是 所 有 的 计算 机 系统 
都 适合 使 用 线程 。 事实 上 ,在 那些 很 少 做 进程 调度 和 切换 的 实时 系统 ,个 人 数字 助理 系统 
中 ,由 于 任务 的 单一 性 ,设置 线程 反而 会 占用 更 多 的 内 存 空 间 和 寄存 器 。 同 时 ,使 用 线程 不 
当 可 能 导致 死 锁 。 



































时 间 用 户 程序 服务 器 1 服务 器 2 
1 1 
RPC 请 求 1 | 








结果 2 
1 
i 线程 阻塞 执行 


(a) 单线 程 时 的 RPC 请 求 处 理 (b) 多 线程 时 的 RPC 请 求 处 理 
图 3-12 ”RPC 请 求 处 理 


@.8 Linux 的 进程 管理 


进程 是 Linux 系统 中 一 个 重要 的 概念 ,Linux 系统 的 一 个 重要 特点 就 是 可 以 同时 启动 
多 个 进程 。 本 节 主 要 介绍 Linux 进程 描述 、 进 程 的 状态 、 进 程 的 控制 及 进程 通信 。 


3.8.1 Linux 进程 概念 与 描述 


Linux 进程 符合 一 般 操 作 系 统 教 材 中 对 进程 概念 的 解释 , 即 进 程 是 一 个 程序 的 一 次 执 
行 的 过 程 ,进程 是 系统 中 最 基本 的 执行 单位 。 程 序 是 静态 的 , 它 是 一 些 保存 在 磁盘 上 的 可 执 
行 的 代码 和 数据 集合 ; 而 进程 是 一 个 动态 的 概念 。 

在 Linux 系统 中 ,进程 仍 是 最 小 的 调度 单位 。 进 程 被 存放 在 叫做 任务 链表 (tasklist) 的 
双向 循环 链表 中 。Linux 中 的 进程 控制 块 是 一 个 名 叫 task_struct 的 数据 结构 ,其 中 包含 了 
很 多 重要 的 信息 , 供 系统 调度 和 进程 本 身 执 行使 用 。 

每 个 进程 用 一 个 task_struct 数据 结构 来 表示 (任务 与 进程 在 Linux 中 可 以 混用 )。 数 
组 task 包含 指向 系统 中 所 有 task_struct 结构 的 指针 。 创 建新 进程 时 ,Linux 将 从 系统 内 存 
中 分 配 一 个 task_struct 结构 并 将 其 加 入 task 数组 。 当 前 运行 进程 的 结构 用 current 指针 
来 指示 。task_struct 结构 部 分 描述 如 下 : 

Struct task_struct { 

volatile long state; /* 进程 的 状态 * / 


unsigned long flags; /* 进程 标志 * / 
mm_segment t addr limit; /* 线性 地 址 空间 * / 


long counter; /* 进程 的 动态 优先 级 * / 


long nice; /* 进程 的 静态 优先 级 * / 
unsigned long policy; /* 进程 采用 的 调度 策略 * / 


Struct mm_struct x mm; /* 进 程 属性 中 指向 内 存 管理 的 数据 结构 mm_structd 的 指针 * / 


81 


82 。 ”操作 系统 原理 及 Linux 内 核 分 析 ( 第 2 版 ) 


> 


}; 


struct task_struct * next task , * prev_task;  /* 进程 通过 这 两 个 指针 组 成 一 个 双向 链表 * / 
struct mm_struct x active mm; /* 指 向 活动 地 址 空间 * / 
/x* task statex / 


pid t pid; /* 进程 标识 符 * / 
gid t gid; /* 进程 组 标号 * / 


uid t uid /* 用 户 标识 * / 


struct task_struct *p opptr, *p pptr, *p cptr, *p ysptr, *p_osptr; 

/* 这 5 个 标志 表示 一 个 进程 在 计算 机 中 的 亲属 关系 ,分 别 代表 祖先 进程 . 父 进 程 、 子 进程 . 弟 进 
/* 程 和 兄 进程 ,为 了 在 两 个 进程 之 间 共 享 方便 而 设立 * / 

Struct list_head thread _ group; 


Struct task_struct * pidhist next; 
struct task_ struct * pidhist pprev; 


/* 上 面 两 个 指针 是 为 了 在 计算 机 中 快速 查 一 个 进程 而 设立 的 * / 


struct fs_struct *fs; /* 指向 和 文件 管理 有 关 的 数据 结构 * / 


task_struct 中 最 重要 的 信息 为 进程 ID 在 上 述 结构 中 定义 为 pid, 进 程 ID 也 被 称 作 进程 标 
识 符 (Process ID,PID) ,是 一 个 非 负 的 整数 ,在 Linux 操作 系统 中 唯一 地 标识 一 个 进程 。 

Linux 中 的 进程 分 为 普通 进程 和 实时 进程 两 种 ,实时 进程 必须 对 外 部 事件 作出 快速 反 
应 ,实时 进程 的 优先 级 高 于 普通 进程 。 


3.8.2 Linux 中 的 进程 状态 及 其 转换 


Linux 中 的 进程 有 5 种 状态 : 

(1) 可 运行 状态 (TASK_RUNNING)。 相 当 于 进程 3 种 基本 状态 中 的 执行 状态 和 就 绪 状 
态 , 正 在 运行 或 准备 运行 的 进程 处 于 这 种 状态 ,处 于 这 种 状态 的 进程 实际 参与 进程 的 调度 。 

(2) 可 中 断 阻 塞 状态 (TASK_INTERRUPTIBLE)。 处 于 这 种 阻塞 状态 中 的 进程 ,通常 
只 要 阻塞 的 原因 解除 ,比如 请 求 资源 未 能 满足 而 阻塞 ,一 旦 资源 满足 后 ,就 可 以 被 唤醒 到 就 


; 也 可 以 由 其 他 进程 通过 信号 或 定时 中 断 唤 醒 , 并 进入 就 绪 队 列 。 这 种 阻塞 状态 类 


似 于 一 般 进程 的 阻塞 状态 。 

(3) 不 可 中 断 阻塞 状态 (TASK_UNINTERRUPTIBLE)。 处 于 这 种 阻塞 状态 的 进程 ， 
只 能 在 资源 请 求 得 到 满足 时 唤醒 到 就 绪 状 态 ,不 能 通过 信号 或 定时 中 断 唤醒 。 

(4) 伪 死 状态 (TASK_ZOMBIE)。 人 处 于 这 种 状态 的 进程 已 经 结束 运行 ,离开 CPU ,并 
归还 所 占用 的 资源 ,只 是 进程 控制 块 (PCB) 结 构 还 没有 归还 释放 。 

(5) 暂停 状态 (TASK_STOPPED)。 处 于 这 种 状态 的 进程 被 暂停 执行 而 阻塞 ,通过 其 
他 进程 的 信号 才能 唤醒 。 导致 暂停 的 原因 有 两 种 : 一 是 收 到 和 暂停 信和 号 (SIGSTOP、 
SIGSTP、SIGTTIN、SIGTTOU); 二 是 受 其 他 进程 的 系统 调用 的 控制 ,而 暂时 把 CPU 交 给 
控制 进程 ,处 于 暂停 状态 。 

这 5 种 状态 不 是 固定 不 变 的 ,它们 随 着 条 件 的 变化 而 转换 ,如 图 3-13 所 示 。 

用 户 进程 执行 do_fork() 函 数 时 创建 一 个 新 的 子 进程 ,该 子 进程 插入 就 绪 队 列 , 处 于 可 
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图 3-13 ”Linux 进程 状态 转换 


运行 状态 。 创 建 一 个 子 进程 时 ,进程 状态 为 不 可 中 断 阻塞 状态 。 在 创建 子 进程 的 工作 结束 
前 把 父 进程 唤醒 为 就 绪 状 态 , 即 可 运行 状态 。 处 于 可 运行 状态 的 进程 插入 就 绪 队 列 中 ,在 适 
当 的 时 候 被 调度 程序 选中 ,可 以 获得 CPU。 占 有 CPU 的 进程 , 当 分 给 它 的 时 间 片 (10ms 的 
整数 倍 ) 用 完 时 ,由 时 钟 中断 触 发 重新 调度 ,使 该 进程 又 回 到 就 绪 状 态 , 并 挂 到 就 绪 队 列 
队 尾 。 

已 经 占有 CPU 并 正在 运行 的 进程 , 若 申请 资源 不 能 满足 , 则 睡眠 阻塞 。 若 调用 sleep_ 
on() ,睡眠 状态 变 为 不 可 中 断 阻塞 状态 。 若 调用 interrupt_sleep_on() ,睡眠 状态 变 为 可 中 
断 阻塞 状态 。 一 旦 进程 变 为 阻塞 状态 ,其 释放 的 CPU 会 马上 被 调度 程序 重新 调度 一 个 就 
绪 进 程 去 占用 ,而 阻塞 的 进程 插入 相应 的 等 待 队列 ,一 旦 资源 满足 后 ,阻塞 的 进程 就 可 以 被 
唤醒 到 就 绪 状 态 ; 也 可 以 由 其 他 进程 通过 信号 或 定时 中 断 唤醒 , 变 为 运行 状态 。 而 处 于 不 
可 中 断 阻塞 状态 的 进程 只 能 由 所 请 求 的 资源 得 到 满足 而 唤醒 ,不 能 由 信号 或 定时 中 断 唤醒 。 
唤醒 后 插入 就 绪 队 列 。 

当 进 程 执行 系统 调用 sys_exit() 或 收 到 SIG KILL 信号 (取消 进程 ) 而 调用 do_exit() 结 
东 时 ,进程 变 为 伪 死 状态 。 此 时 ,归还 它 所 占有 的 资源 ,同时 启动 进程 调度 系统 程序 
schedule() 重 新 调度 ,让 其 他 就 绪 者 占有 CPU。 如 果 进 程 通过 系统 调用 设置 跟踪 标志 , 则 在 
系统 调用 返回 前 进入 系统 调用 跟踪 (syscall_trace() ) ,进程 状态 就 变 为 暂停 状态 。CPU 经 
重新 调度 给 其 他 进程 , 仅 当 其 他 进程 发 出 暂停 进程 信号 (SIG KILL) 或 SIG CONT 时 ,才能 
把 暂停 状态 唤醒 ,重新 插入 就 绪 队 列 。 


3.8.3 Linux 的 进程 控制 
1. 进程 的 建立 





























Linux 中 的 绝 大 多 数 进程 也 是 有 生命 期 的 , 因 创 建 而 产生 , 因 调 度 而 运行 , 因 撤销 而 消 
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失 。 系 统 启动 时 运行 于 核心 模式 ,此 时 只 有 一 个 初始 化 进程 , 即 0# 进程 。 当 系统 初始 化 完 
毕 后 ,初始 化 进程 启动 init 进程 ,然后 进入 空闲 等 待 的 循环 中 。 

init 进程 即 1# 进程 , 它 完成 一 些 系 统 初始 化 工作 ,如 打开 系统 控制 台 、 装 根 文件 系统 
等 。 初 始 化 工作 结束 后 ,init 进程 通过 系统 调用 fork() 为 每 个 终端 创建 一 个 终端 子 进 程 为 
用 户 服务 ,如 等 待 用 户 登 录 .执行 Shell 命令 解释 程序 等 。 每 个 终端 进程 又 可 创建 自己 的 子 
进程 ,从 而 形成 一 棵 进程 树 。 

在 Linux 系统 中 ,系统 函数 fork() 、vfork() 和 clone() 都 可 以 创建 一 个 进程 ,但 它们 都 
是 通过 内 核 郴 数 do_fork() 实 现 的 。 

do_fork() 函 数 的 主要 工作 如 下 : 

(1) 为 新 进程 分 配 一 个 唯一 的 进程 标识 号 PID 和 task_struct 结构 ,然后 把 父 进程 中 
PCB 的 内 容 复 制 给 新 进程 后 检查 用 户 具 有 执行 一 个 新 进程 的 必需 的 资源 。 

(2) 设置 task_struct 中 与 父 进程 值 不 同 的 数据 成 员 ,如 初始 化 自 旋 锁 、 初 始 化 堆栈 信 
息 等 ,同时 会 把 新 创建 的 子 进程 运行 状态 置 为 TASK_RUNNING( 这 里 应 该 是 就 绪 态 ) 。 

(3) 设置 进程 管理 信息 ,根据 do_fork() 提 供 的 clone_flags 参数 值 , 决 定 是 否 对 父 进 程 
task_struct 结构 中 的 文件 系统 .已 打开 的 文件 指针 等 所 选择 的 部 分 进行 复制 ,增加 与 父 进 
程 相关 联 的 有 关 文 件 系统 的 进程 引用 数 。 

(4) 初始 化 子 进程 的 内 核 栈 。 通 过 复制 父 进程 的 上 下 文 来 初始 化 新 进程 的 硬件 上 下 
文 。 把 新 进程 加 入 到 pidhash[ ] 散 列表 中 ,并 增加 任务 计数 值 。 

(5) 启动 调度 程序 使 子 进程 获得 运行 机 会 。 向 父 进程 返回 子 进程 的 PID。 设 置 子 进程 
在 系统 调用 do_fork() 时 返回 0。 

例 3-11 调用 fork() 创 建 子 进程 的 例子 。 

/* fork_test.cx / 


# include < sys/types.h> 
#inlcude < unistd.h> 


main( ) 

{ 
pid_t pid; /* 此 时 仅 有 一 个 进程 */ 
pid = fork(); /* 此 时 已 经 有 两 个 进程 在 同时 运行 * / 
if(pid<0) 


printf("error in fork!"); 
else if(pid==0) 
printf£("T am the child process, my process 1D is $d\n",getpid()); 
else 
printf("I am the parent process, my process ID is % d\n",getpid()); 
} 


编译 并 运行 : 


$ gcc fork test.c —o fork test 

$ . /fork_test 

I am the parent process, my process ID is 1991 
I am the child process, my process ID is 1992 


在 这 个 程序 中 ,在 语句 pid 二 fork(); 之 前 ,只 有 一 个 进程 在 执行 这 段 代码 ,但 在 这 条 语 


名 之 后 ,就 变 成 两 个 进程 在 执行 了 ,这 两 个 进程 的 代码 部 分 完全 相同 ,将 要 执行 的 下 一 条 语 
句 都 是 if(pid 二 二 0)…。 两 个 进程 中 ,原先 就 存在 的 那个 被 称 作 父 进程 ,新 出 现 的 那个 被 称 
作 子 进程 。 父 子 进程 的 区 别 除了 进程 标识 符 (PID) 不 同 外 ,变量 pid 的 值 也 不 相同 ,pid 存放 
的 是 fork() 的 返回 值 。fork() 调 用 的 一 个 奇妙 之 处 就 是 它 仅 仅 被 调用 一 次 , 却 能 够 返回 两 
次 , 它 可 能 有 3 种 不 同 的 返回 值 : 

(1) 在 父 进程 中 ,fork() 返 回 新 创建 子 进程 的 PID。 

(2) 在 子 进程 中 ,fork() 返 回 0。 

(3) 如 果 出 现 错误 ,forkO 〇 返回 一 个 负 值 。 

在 此 程序 中 如 果 pid 小 于 0, 说 明 出 现 了 错误 ; pid 王 一 0, 就 说 明 fork 返回 了 0, 也 就 说 
明 当 前 进程 是 子 进程 ,就 去 执行 printf("I am the child process…") ,否则 当前 进程 就 是 父 进 
程 ,执行 printf("I am the parent process…") 。 


2. 进程 的 撤销 


当 进 程 执 行 完毕 , 即 正常 结束 时 ,调用 exit() 自 我 终止 。 当 进程 受 某 种 信和 号 (如 
SIGKILL) 的 作用 时 ,也 经 过 执行 exit 〇 而 撤销 。 进 程 被 撤销 时 ,一 方面 要 收回 进程 所 占用 
的 资源 , 另 一 方面 还 必须 通知 其 父 进程 和 子 进程 ,对 一 些 信号 作 必 要 的 处 理 。 

进程 终止 的 系统 调用 sys_exit 通过 调用 do_exit() 函数 实现 。do_exit() 系 统 调 用 主要 
完成 下 列 工作 : 

(1) 将 进程 的 状态 标志 设 为 PF_EXITING ,表示 进程 正在 退出 状态 。 

(2) 释放 分 配给 这 个 进程 的 大 部 分 资源 ,包括 内 存 、 线 性 区 描述 符 和 页 表 、 文 件 对 象 相 

(3) 向 父 进程 发 送信 号 ,给 其 子 进程 重新 找 父 进程 。 

(4) 将 进程 设置 为 TASK_ZOMBIE( 伪 死 ) 状 态 , 使 进程 不 会 再 被 调度 。 

(5) 调用 schedule() ,重新 调度 其 他 进程 执行 。 

处 于 “ 僵 死 状态 ”的 进程 运行 已 经 结束 ,不 会 再 被 调度 ,内 核 释 放 了 与 其 相关 的 所 有 资 
源 , 但 其 进程 控制 块 还 没有 释放 ,由 其 父 进程 调用 wait() 函 数 来 查询 子孙 进程 的 退出 状态 ， 
释放 进程 控制 块 。 

在 后 面 的 例 3-12 中 , 父 进程 调用 函数 wait(0) 等 待 子 进程 写 入 信息 , 子 进程 在 写 人 信息 
后 调用 函数 exit(0) 退 出 。 


3. 程序 的 装 入 和 执行 


当 父 进程 使 用 fork() 系 统 调用 创建 了 子 进程 之 后 , 子 进 程 继承 了 父 进 程 的 正文 段 和 数 
据 段 ,从 而 执行 和 父 进程 相同 的 程序 段 。 为 了 使 fork() 产 生 的 子 进程 可 以 执行 一 个 指定 的 
可 执行 文件 ,系统 内 核 中 开发 了 一 个 系统 函数 调用 exec()。 它 是 一 个 调用 族 ,每 个 调用 函 
数 参 数 稍 有 不 同 , 但 目的 都 是 把 文件 系统 中 的 可 执行 文件 调 入 并 覆盖 调用 进程 的 正文 段 和 
数据 段 之 后 执行 。 


3.8.4 Linux 的 进程 通信 
Linux 提供 的 进程 通信 方式 和 原理 与 UNIX 的 通信 机 制 一 样 ,有 管道 方式 、 信 号 方式 
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和 System V 的 IPC 通信 和 机制 。 下 面 分 别 进行 介绍 。 
1. 管道 通信 方式 


管道 通信 方式 是 传统 的 进程 通信 技术 。 管 道 通信 技术 又 分 为 无 名 管道 和 有 名 管道 两 种 
类 型 。 

无 名 管道 为 建立 管道 的 进程 及 其 子孙 进程 提供 一 条 以 比特 流 方式 传递 消息 的 通信 管 
道 。 该 管道 在 逻辑 上 被 看 做 管道 文件 ,在 物理 上 则 由 文件 系统 的 高 速 缓存 区 构成 。 发 送 进 
程 利 用 系统 调用 write (fd[1], buf, size) 把 buf 中 的 长 度 为 size 字符 的 消息 送 入 管道 口 
fd[1] ,接收 进程 则 使 用 系统 调用 read(fdL0],buf,size) 从 管道 出 口 fd[0] 读 出 size 字符 的 消 
息 送 入 buf 中 。 此 外 ,管道 按 先进 先 出 (FIFO) 方 式 传递 消息 , 且 只 能 单 向 传递 ,如 图 3-14 


所 示 o 
写 入 端 td[1] SE 读 出 端 fi[0] 


图 3-14 管道 通信 示意 图 


例 3-12 用 C 语言 编写 一 个 C 程序 ,建立 一 个 管道 ,同时 父 进程 生成 一 个 子 进程 , 子 进 
程 向 管道 中 写 人 一 个 字符 串 , 父 进程 从 管道 中 读 出 该 字符 串 , 从 而 实现 数据 的 传递 。 程 序 
如 下 : 


# include < stdio.h> 
main() 
{ 
int x, fd[ 2]; 
char buf[50], s[50]; 
pipe(fd); /* 系统 调用 ,可 建立 一 条 同步 通信 管道 */ 
while((x= fork()) == —1); 
if (x== 0) 
{ 
sprintf(buf, "This is an example of pipe\n"); 
write(fd[1], buf, 50); 
exit(0); 
} 
else 
{ 
wait(0); 
read(fd[0],s,50); 
printf("%s",s); 


} 
在 Linux 中 ,管道 是 通过 指向 同一 个 临时 VFS 的 i 节点 的 两 个 文件 file 数据 结构 的 文 
件 描述 符 实现 的 。 如 图 3-15 所 示 。 
VFS 中 i 节点 指向 内 存 中 的 一 个 物理 页 面 ,进程 各 自 的 file 结构 都 有 f_op 操作 项 ,分 
别 指向 管道 写 操作 和 管道 读 操作 。 当 写 人 过 程 对 管道 进行 写 人 操作 时 ,数据 被 复制 到 共享 

























































































进程 A 进程 B 
file file 
f mode f mode 
f_pos 人 pos 
f flags f flags 
f count f_ count 
f owner 人 owner 
f inode f inode 
f op fop 
f_version 物理 页 面 f_version 
1 
管道 写 操作 管道 读 操作 
write(fd, buf, size) read(fd, buf, size) 


图 3-15 管道 结构 示意 图 


的 数据 页 面 中 ,而 读 取 进程 则 从 管道 的 共享 数据 页 面 中 复制 数据 ,从 而 实现 了 进程 之 间 的 数 
据 传递 。 

Linux 必须 保证 对 管道 访问 的 同步 ,为 此 需要 使 用 锁 、 等 待 队 列 和 信号 量 等 同步 机 制 。 
当 管 道 写 和 进程 欲 对 管道 写 信 时 ,该 进程 使 用 标准 的 文件 写 函 数 pipe_write() 。 表 示 打 开 
文件 和 打开 管道 的 描述 符 用 来 对 进程 的 file 数据 结构 进行 索引 。Linux 系统 调用 使 用 由 管 
道 file 数据 结构 的 f_op 属性 指向 的 管道 写 过 程 ,这 个 写 过 程 用 保存 在 表示 管道 的 VFS i 节 
点 中 的 信息 来 管理 写 人 请求。 

只 要 管道 未 被 读 出 进程 加 锁 , 系 统 就 为 写 人 进程 对 管道 加 锁 ,并 将 写 入 进程 地 址 空间 中 
的 数据 复制 到 共享 数据 页 面 中 。 若 管道 已 被 读 取 进程 加 锁 , 或 者 没有 足够 空间 存储 数据 , 则 
当前 进程 将 进入 管道 i 节点 等 待 队列 ,同时 进程 调度 程序 选择 其 他 进程 投入 执行 。 若 写 进 
程 是 可 中 断 的 , 当 有 足够 的 空间 或 管道 被 解锁 时 ,该 进程 将 被 读 取 进程 唤醒 。 在 数据 写 入 
时 ,管道 的 VFS i 节点 解锁 ,同时 所 有 在 该 节点 的 等 待 队列 上 睡眠 的 读 出 进程 都 将 被 唤醒 。 

从 管道 中 读 出 数据 的 过 程 与 写 人 过 程 类 似 。Linux 允许 进程 以 非 阻塞 的 方式 读 出 管道 
的 内 容 。 此 时 如 果 没 有 数据 可 读 或 者 管道 被 加 锁 , 则 返回 出 错 信 息 。 阻 塞 方式 则 使 该 进程 
在 管道 i 节点 的 等 待 队 列 上 睡眠, 直到 写 进程 写 入 操作 的 结束 。 当 两 个 进程 对 管道 的 使 用 
结束 后 ,管道 i 节点 或 共享 数据 页 面 同时 被 释放 。 

Linux 还 支持 有 名 管道 (named pipe) , 即 FIFO 管道 。 这 种 管道 总 是 按 先进 先 出 的 原则 
工作 ,第 一 个 被 写 入 的 数据 将 首先 从 管道 中 读 出 。 和 无 名 管道 不 同 的 是 ,有 名 管道 不 是 临时 
对 象 ,而 是 文件 系统 中 的 实体 ,并 且 可 以 通过 mkfifo 命令 来 创建 。 进 程 只 要 拥有 适当 的 权 
限 就 可 以 自由 地 使 用 有 名 管道 。 

无 名 管道 需要 先 创建 (建立 file 数据 结构 、VFS i 节点 和 共享 数据 页 面 ) ,而 有 名 管道 已 
经 存在 ,使 用 者 只 需 打开 与 关闭 。 在 写 入 进程 打开 有 名 管道 之 前 ,Linux 必须 让 读 出 进程 先 
打开 此 管道 ,任何 读 出 进程 从 中 读 出 之 前 必须 有 写 入 进程 向 其 中 写 和 人 数据。 有 名 管道 的 使 
用 方法 与 无 名 管道 基本 相同 ,也 使 用 相同 的 数据 结构 和 操作 。 


2. 信号 


信号 主要 用 来 向 进程 发 送 异 步 的 事件 信号 ,发 送信 号 表明 要 求 一 个 进程 做 某 件 事 。 用 
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户 可 以 用 键盘 中 断 产 生 信号 ,中断 一 个 进程 的 运行 ,而 浮 点 运算 溢出 或 者 内 存 访问 错误 等 也 
可 产生 信号 ,告知 相关 的 进程 产生 了 异步 事件 。 进 程 可 以 选择 对 某 种 信号 所 采取 的 特定 操 
作 , 这 些 操 作 包 括 : 

(1) 忽略 信号 和 阻塞 信和 号。 进程 可 忽略 产生 的 信号 ,但 SIGKILL 和 SIGSTOP 信号 不 
能 被 忽略 ; 进程 可 选择 阻塞 某 些 信和 号。 

(2) 由 进程 处 理 该 信号 。 进 程 本 身 可 在 系统 中 注册 处 理 信号 的 处 理 程序 地 址 , 当 发 出 
该 信号 时 ,由 注册 的 处 理 程序 处 理 信号 。 

(3) 由 内 核 进行 默认 处 理 。 信 号 由 内 核 的 默认 处 理 程序 处 理 。 大 多 数 情况 下 ,信号 由 
内 核 进行 处 理 。 

在 Linux 内 核 中 不 存在 任何 机 制 用 来 区 分 不 同 信号 的 优先 级 。 也 就 是 说 ,多 个 信号 发 
出 时 ,进程 可 能 会 以 任意 顺序 接收 到 信号 并 进行 处 理 。 另 外 ,如 果 进 程 在 处 理 某 个 信号 之 前 
又 有 相同 的 信号 发 出 , 则 进程 只 能 接收 到 一 个 信号 。 

系统 在 task_struct 结构 中 利用 两 个 字 分 别 记录 当前 挂 起 的 信号 (signal) 以 及 当前 阻塞 
的 信号 (blocked) 。 挂 起 的 信号 指 尚未 进行 处 理 的 信号 ,阻塞 的 信号 指 进程 当前 不 处 理 的 信 
号 。 如 果 产 生 了 某 个 当前 被 阻塞 的 信和 号 , 则 该 信和 号 会 一 直 保持 挂 起 ,直到 该 信号 不 再 被 阻塞 
为 止 。 除 了 SIGKILL 和 SIGSTOP 信号 外 ,所 有 的 信号 均 可 以 被 阻塞 ,信号 的 阻塞 可 通过 
系统 调用 实现 。 每 个 进程 的 task_struct 结构 中 还 包含 了 一 个 指向 sigaction 结构 数组 的 指 
针 ,该 结构 数组 中 的 信息 实际 指定 了 进程 处 理 所 有 信号 的 方式 。 如 果 某 个 sigaction 结构 中 
包含 处 理 信号 的 例 程 地 址 , 则 由 该 处 理 例 程 处 理 该 信号 ; 反之 , 则 根据 结构 中 的 一 个 标志 或 
者 由 内 核 进 行 默 认 处理 , 也 可 以 直接 忽略 该 信号 。 通 过 系统 调用 ,进程 可 以 修改 sigaction 
结构 数组 的 信息 ,从 而 指定 进程 处 理 信号 的 方式 。 

进程 不 能 向 系统 中 所 有 的 进程 发 送信 号 。 一 般 而 言 , 除 系统 和 超级 用 户外 ,普通 进程 只 
会 向 具有 相同 uid 和 gid 的 进程 或 者 处 于 同一 进程 组 的 进程 发 送信 号 。 产 生 信号 时 ,内 核 
将 进程 task_struct 的 signal 字 中 的 相应 位 设置 为 1. 从 而 表明 产生 了 该 信号 。 系 统 不 对 其 
置 位 之 前 该 位 已 经 为 1 的 情况 进行 处 理 , 因 而 进程 无 法 接收 到 前 一 次 信号 。 如 果 进 程 当 前 
没有 阻塞 该 信号 ,并 且 进 程 正 处 于 可 中 断 的 等 待 状态 , 则 内 核 将 该 进程 的 状态 改变 为 运行 ， 
并 放置 在 运行 队列 中 。 这 样 , 调 度 程序 在 进行 调度 时 就 有 可 能 选择 该 进程 运行 ,从 而 可 以 让 
进程 处 理 该 信号 。 

发 送 给 某 个 进程 的 信号 并 不 会 立即 得 到 处 理 , 相 反 , 只 有 该 进程 再 次 运行 时 , 才 有 机 会 
处 理 该 信号 。 每 次 进程 从 系统 调用 中 退出 时 ,内 核 会 检查 它 的 signal 和 block 字段 ,如 果 有 
任何 一 个 未 被 阻塞 的 信号 发 出 ,内 核 就 根据 sigaction 结构 数组 中 的 信息 进行 处 理 。 处 理 过 
程 如 下 : 

(1) 检查 对 应 的 sigaction 结构 ,如 果 该 信号 不 是 SIGKILL 或 SIGSTOP 信和 号 , 且 被 忽 
略 , 则 不 处 理 该 信号 。 

(2) 如 果 该 信和 号 利用 默认 的 处 理 程序 处 理 , 则 由 内 核 处 理 该 信和 号 ,否则 转向 第 (3) 步 。 

(3) 该 信号 由 进程 自己 的 处 理 程序 处 理 , 内 核 将 修改 当前 进程 的 调用 堆栈 帧 ,并 将 进程 
的 程序 地 址 寄存 器 修改 为 信号 处 理 程序 的 入 口 地 址 。 此 后 ,指令 将 跳 转 到 信号 处 理 程序 , 当 
从 信和 号 处 理 程序 中 返回 时 ,实际 就 返回 了 进程 的 用 户 模式 部 分 。 


3. UNIX System V IPC 机 制 


Linux 支持 UNIX System V IPC(Interprocess Communication ,进程 间 通 信 ) 机 制 : 消 
息 队 列 、 信 号 量 和 共享 内 存 。 在 IPC 机 制 中 ,系统 在 创建 这 3 种 对 象 时 就 给 每 个 对 象 设 定 
了 一 个 ipc_perm 结构 的 访问 权限 ,并 返回 一 个 标识 。 进 程 通信 时 必须 先 传递 该 标识 , 待 
ipcperms() 函 数 确认 权限 后 才 可 以 访问 通信 资源 。 

1) 消息 队列 

一 个 或 多 个 进程 可 向 消息 队列 写 入 消息 ,而 一 个 或 多 个 进程 可 从 消息 队列 中 读 取消 息 ， 
这 种 进程 间 通信 机 制 通常 使 用 在 客户 /服务 器 模型 中 ,客户 向 服务 器 发 送 请 求 消息 ,服务 器 
读 取 消息 并 执行 相应 请 求 。 在 许多 微 内 核 结 构 的 操作 系统 中 ,内 核 和 各 组 件 之 间 的 基本 通 
信 方 式 就 是 消息 队列 。 例 如 ,在 MINIX 操作 系统 中 ,内 核 .1/O 任务、 服务 器 进程 和 用 户 进 
程 之 间 就 是 通过 消息 队列 实现 通信 的 。 

Linux 为 系统 中 所 有 的 消息 队列 维护 一 个 msgque 链表 ,该 链表 中 的 每 个 指针 指向 一 个 
msgid_ds 结构 ,该 结构 完整 地 描述 一 个 消息 队列 。 当 建立 一 个 消息 队列 时 ,系统 从 内 存 中 
分 配 一 个 msgid_ds 结构 并 将 指针 添加 到 msgque 链表 中 。 

图 3-16 是 msgid_ds 结构 的 示意 图 。 从 图 中 可 以 看 出 ,每 个 msgid_ds 结构 都 包含 一 个 
ipc_perm 结构 的 msg_perms 指针 ,表明 该 消息 队列 的 操作 权限 以 及 指向 该 队列 所 包含 的 消 
息 (msg 结构 ) 的 指针 。 显 然 ,队列 中 的 消息 构成 了 一 个 链表 。 另 外 ,Linux 还 在 msgid_ds 
结构 中 包含 了 一 些 有 关 修 改 时 间 之 类 的 信息 ,同时 包含 两 个 等 待 队列 ,分别 用 于 队列 的 写 入 
进程 和 队列 的 读 取 进 程 。 
































msgque msgid_ds msg msg 
msg_perms msg next “六 一 一 msg_next 
| msg_first | 一 四 msg_spot 
msg_last | msg_stime 
| msg_ts 
| message 























图 3-16 Linux 消息 队列 


消息 队列 是 进程 所 读 写 的 消息 的 存储 空间 。 每 当 进 程 希 望 对 指定 队列 进行 写 消息 操作 
的 时 候 ,就 发 出 系统 调用 : 


sys_ipc (MSGSND, msgid, msgsz, msgf1g, msgp); 


该 进程 的 标识 uid、gid 都 首先 与 该 队列 ipc_perm 的 对 应 属性 相 比 较 。 检 查 通过 后 ,将 
消息 复制 到 msg 结构 ,再 挂 到 消息 队列 的 末尾 。 如 果 消 息 队 列 一 时 无 法 接收 该 消息 (可 能 
空间 不 够 ), 写 消息 的 进程 暂时 进入 msgid_ds 结构 的 写 等 待 队 列 , 直 到 这 个 队列 的 一 些 消息 
读 走 后 ,该 进程 才 被 唤醒 。 

读 消 息 进程 的 工作 进程 与 写 消息 类 似 。 进 程 发 出 以 下 系统 调用 : 


sys_ipc(MSGRCV, msgid, msgsz, msgf1g, msgp); 


内 核 系统 首先 检查 访问 权限 ,通过 后 , 读 取 第 一 条 消息 ,或 读 取 指定 类 型 的 消息 。 如 果 
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进程 选择 的 消息 不 存在 , 则 进入 msgid_ds 结构 的 读 等 待 队列 , 当 等 待 的 消息 进入 队列 时 才 
被 唤醒 。 

2) 信号 量 

在 操作 系统 中 ,信号 量 最 简单 的 形式 是 一 个 整数 ,多 个 进程 可 检查 并 设置 信号 量 的 值 。 
这 种 检查 和 设置 操作 是 不 可 被 中 断 的 ,也 称 为 原子 操作 。 检 查 和 设置 操作 的 结果 是 信号 量 
的 当前 值 和 设置 值 相 加 的 结果 ,该 设置 值 可 以 是 正 值 ,也 可 以 是 负 值 。 根 据 检查 和 设置 操作 
的 结果 ,进行 操作 的 进程 可 能 会 进入 休眠 状态 ,而 当 其 他 进程 完成 自己 的 检查 并 设置 操作 
后 ,由 系统 检查 前 一 个 休眠 进程 是 否 可 以 在 新 信号 量 值 的 条 件 下 完成 相应 的 检查 和 设置 操 
作 。 这 样 ,通过 信号 量 就 可 以 协调 多 个 进程 的 操作 。 

信号 量 可 用 来 实现 所 谓 的 “关键 段 "。 关 键 段 指 同 一 时 刻 只 能 有 一 个 进程 执行 其 中 代码 
的 代码 段 。 也 可 用 信号 量 解决 经 典 的 生产 者 -消费 者 问题 。 

Linux 利用 semid_ds 结构 来 表示 System V IPC 信号 量 , 见 图 3-17。 和 消息 队列 类 似 ， 
系统 中 所 有 的 信号 量 组 成 了 一 个 semary 链表 ,该 链表 的 每 个 节点 指向 一 个 semid_ds 结构 。 
从 图 3-17 可 以 看 出 ,semid_ds 结构 的 sem_base 指向 一 个 信号 量 数组 ,允许 操作 这 些 信号 量 
数组 的 进程 可 以 利用 系统 调用 执行 操作 。 系 统 调用 可 指定 多 个 操作 ,每 个 操作 由 3 个 参数 
指定 : 信号 量 索引 、 操 作 值 和 操作 标志 。 信 号 量 索引 用 来 定位 信号 量 数组 中 的 信号 量 ; 操 
作 值 是 要 和 信和 号 量 的 当前 值 相 加 的 数值 。 首 先 ,Linux 按 如 下 的 规则 判断 是 否 所 有 的 操作 
都 可 以 成 功 : 操作 值 和 信号 量 的 当前 值 相 加 大 于 0, 或 操作 值 和 当前 值 均 为 0, 则 操作 成 功 。 
如 果 系 统 调 用 中 指定 的 所 有 操作 中 有 一 个 操作 不 能 成 功 , 则 Linux 会 挂 起 这 一 进程 。 但 是 ， 
如 果 操 作 标志 指定 这 种 情况 下 不 能 挂 起 进程 ,系统 调用 返回 并 指明 信号 量 上 的 操作 没有 成 
功 ,而 进程 可 以 继续 执行 。 如 果 进 程 被 挂 起 ,Linux 必须 保存 信号 量 的 操作 状态 并 将 当前 进 
程 放 入 等 待 队列 。 为 此 ,Linux 在 堆栈 中 建立 一 个 sem_queue 结构 并 填充 该 结构 ,将 新 的 
sem_queue 结构 添加 到 信号 量 对 象 的 等 待 队列 中 (利用 sem_pending 和 sem_pending_last 
指针 ) ,将 当前 进程 放 入 sem_queue 结构 的 等 待 队列 中 (sleeper) ,然后 调用 调度 程序 选择 其 
他 的 进程 运行 。 
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如 果 所 有 的 信号 量 操作 都 成 功 了 ,当前 进程 可 继续 运行 。 在 此 之 前 ,Linux 负责 将 操作 
实际 应 用 于 信号 量 队 列 的 相应 元 素 。 这 时 ,Linux 检查 任何 等 待 的 或 挂 起 的 进程 ,看 它们 的 
信号 量 操作 是 否 可 以 成 功 。 如 果 这 些 进 程 的 信号 量 操作 可 以 成 功 ,Linux 就 会 将 它们 从 挂 
起 队列 中 移 去 ,并 将 它们 的 操作 实际 应 用 于 信号 量 队 列 。 同 时 ,Linux 会 唤醒 休眠 进程 ,以 
便 在 下 次 调度 程序 运行 时 可 以 运行 这 些 进程 。 当 新 的 信号 量 操作 应 用 于 信号 量 队列 之 后 ， 
Linux 会 接着 检查 挂 起 队列 ,直到 没有 操作 可 成 功 或 没有 挂 起 进程 为 止 。 

和 信和 号 量 操作 相关 的 概念 还 有 死 锁 。 当 某 个 进程 修改 了 信号 量 而 进入 关键 段 之 后 , 却 
因为 崩溃 而 没有 退出 关键 段 ,这 时 ,其 他 被 挂 起 在 信号 量 上 的 进程 永远 得 不 到 运行 机 会 , 
就 是 所 谓 的 死 锁 。Linux 通过 维护 一 个 信号 量 数 组 的 调整 链表 来 避免 这 一 问题 。 

3) 共享 内 存 

Linux 采用 的 是 虚 存 、 管 理 机 制 ( 见 5.7 节 ), 因 此 ,进程 的 虚拟 地 址 可 以 映射 到 任意 一 
处 物理 地 址 ,这 样 ,如 果 两 个 进程 的 虚拟 地 址 映射 到 同一 物理 地 址 ,这 两 个 进程 就 可 以 利用 
这 一 虚拟 地 址 进行 通信 。 但 是 ,一 旦 内 存 被 共享 之 后 ,对 共享 内 存 的 访问 同步 需要 由 其 他 
IPC 机 制 (例如 信号 量 ) 来 实现 。Linux 中 的 共享 内 存 通过 访问 键 来 访问 ,并 进行 访问 权限 
的 检查 。 共 享 内 存 对 象 的 创建 者 负责 控制 访问 权限 以 及 访问 键 的 公有 或 私有 特性 。 如 果 具 
有 足够 的 权限 ,也 可 以 将 共享 内 存 锁定 到 物理 内 存 中 。 

图 3-18 是 Linux 中 共享 内 存 对 象 的 结构 。 每 个 新 创建 的 共享 内 存 区 域 由 一 个 shmid_ 
ds 数据 结构 来 表示 。 它 们 被 保存 在 shm_segs 数组 中 。shmid_ds 数据 结构 描述 共享 内 存 的 
大 小 、 进 程 如 何 使 用 以 及 共享 内 存 映 射 到 其 各 自 地 址 空间 的 方式 。 由 共享 内 存 创 建 者 控制 
对 此 内 存 的 存 取 权 限 以 及 其 键 是 公有 还 是 私有 。 如 果 它 有 足够 权限 ,还 可 以 将 此 共享 内 存 
加 载 到 物理 内 存 中 。 每 个 使 用 此 共享 内 存 的 进程 必须 通过 系统 调用 将 其 连接 到 虚拟 内 存 
上 。 这 时 进程 创建 新 的 vm_area_struct 来 描述 此 共享 内 存 。 进 程 可 以 决定 此 共享 内 存在 其 
虚拟 地 址 空间 的 位 置 ,或 者 让 Linux 选择 一 块 足够 大 的 区 域 。 新 的 vm_area_struct 结构 将 
被 放 到 由 shmid_ds 指向 的 vm_area_struct 链表 中 。 通 过 vm_next_shared 和 vm_prev_ 
shared 指针 将 它们 连接 起 来 。 虚 拟 内 存在 连接 时 并 没有 创建 ,而 在 进程 访问 它 时 才 创 建 。 
和 消息 队列 及 信号 量 类 似 ,Linux 中 也 有 一 个 链表 维护 着 所 有 的 共享 内 存 对 象 。 


shm_segs shmid_ds vm_area_struct vm_area_struct 








shm_perm 





vm_next_shared MM vm_next_shared 




















shm_pages 





array of pte 





attaches 


























3-18 ”Linux 共享 内 存 


某 个 进程 第 一 次 访问 共享 虚拟 内 存 时 将 产生 页 故障 。 这 时 ,Linux 找 出 描述 该 内 存 的 
vm_area_struct 结构 ,该 结构 中 包含 用 来 处 理 这 种 共享 虚拟 内 存 的 处 理 函 数 地 址 。 共 享 内 
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存 页 故障 处 理 代 码 在 shmid_ds 的 页 表 项 链表 中 查找 ,以 便 查看 是 否 存在 该 共享 虚拟 内 存 的 
页 表 项 。 如 果 没 有 ,系统 将 分 配 一 个 物理 页 并 建立 页 表 项 。 该 页 表 项 加 入 shmid_ds 结构 的 


同时 也 添 力 
程序 将 使 月 


到 进程 的 页 表 中 。 此 后 , 当 另 一 个 进程 访问 该 共享 内 存 时 ,共享 内 存 页 故障 处 理 
日 同一 物理 页 ,而 只 是 将 页 表 项 添加 到 这 一 进程 的 页 表 中 。 这 样 ,前 后 两 个 进程 就 





可 以 通过 同一 物理 页 进行 通信 。 

当 进 程 不 再 共享 此 虚拟 内 存 时 ,进程 和 共享 内 存 的 连接 将 被 断 开 。 如 果 其 他 进程 还 在 
使 用 这 个 内 存 , 则 此 操作 只 影响 当前 进程 。 其 对 应 的 vm_area_struct 结构 将 从 shmid_ds 结 
构 中 删除 并 回收 。 当 前 进程 对 应 此 共享 内 存 地 址 的 页 表 入 口 也 将 被 更 新 并 置 为 无 效 。 当 最 
后 一 个 进程 断 开 与 共享 内 存 的 连接 时 ,当前 位 于 物理 内 存 中 的 共享 内 存 页 面 将 被 释放 ,同时 
释放 的 还 有 此 共享 内 存 的 shmid_ds 结构 。 


习题 


oo 口罩 一 


四 二 


. 程序 的 顺序 执行 和 并 发 执行 各 有 什么 特点 ? 

.进程 的 定义 是 什么 ? 为 什么 要 引入 进程 ? 
.进程 和 程序 有 什么 区 别 ? 

. 进程 有 哪些 特征 ?基本 特征 是 什么 ? 

. 进程 的 静态 描述 由 哪儿 部 分 组 成 ? 

. 为 什么 说 进程 控制 块 是 操作 系统 感知 进程 存在 的 唯一 标志 ? 
. 进程 在 运行 过 程 中 有 哪些 基本 状态 ? 各 状态 之 间 转 换 的 条 件 是 什么 ? 
. 试 述 引 起 进程 创建 的 主要 事件 。 

. 试 述 引 起 进程 被 撤销 的 主要 事件 。 

. 试 述 引 起 进程 阻塞 或 唤醒 的 主要 事件 。 

. 试 述 创建 进程 原 语 的 主要 工作 。 


12. 试 述 撤销 进程 原 语 的 主要 工作 。 

13. 试 述 进 程 阻塞 原 语 的 主要 工作 。 

14. 试 述 进 程 唤醒 原 语 的 主要 工作 。 

15, 什么 是 临界 资源 ?什么 叫 临界 区 ? 试 举例 说 明 。 

16. 并 发 进程 间 的 制约 有 哪 两 种 ? 引起 制约 的 原因 是 什么 ? 
17. 什么 是 进程 间 的 互 斥 关系 ? 什么 是 进程 间 的 同步 关系 ? 
18. 什么 是 原 语 ? 用 户 进程 通过 什么 方式 访问 内 核 原 语 ? 
19. 为 什么 说 在 阻塞 原 语 的 最 后 必须 转 和 人 进程 调度 ? 

20. 互 斥 机 构 应 遵循 的 准则 是 什么 ? 

21. 简 述 P、V 原 语 的 主要 操作 。 


22. 下 


\V 操作 的 物理 意义 是 什么 ? 


23. 如 何 用 信号 量 实现 进程 间 的 互 斥 ?” 举例 说 明 。 
24. 什么 叫 进程 通信 ? 进程 通信 有 哪 两 类 ? 

25. 根据 数据 存 取 的 方式 ,进程 高 级 通信 方式 有 哪些 ? 
26. 为 什么 在 操作 系统 中 引入 线程 ? 


27. 试 述 线程 与 进程 的 区 别 与 联系 。 

28. 试 述 用 户 态 线程 和 核心 态 线程 的 优 缺 点 。 

29. 试 画 出 下 面 6 条 语句 的 前 趋 图 ,并 用 P、V 操作 描述 它们 之 间 的 同步 关系 。 

Sl: XI 一 axay 

S2: X2=3*b; 

S3: X3=5*a; 

S4: X4 一 X1 十 X2; 

S5: X5 一 b 十 X3; 

S6: X6=X4/X5; 

30. 有 3 个 进程 PA、PB、PC 合作 解决 文件 打印 问题 : PA 将 文件 记录 从 磁盘 读 入 主 存 
的 缓冲 区 1, 每 执行 一 次 读 一 个 记录 ; PB 将 缓冲 区 1 的 内 容 复制 到 缓冲 区 2, 每 执行 一 次 复 
制 一 个 记录 ; PC 将 缓冲 区 2 的 内 容 打 印 出 来 ,每 执行 一 次 打印 一 个 记录 。 缓 冲 区 的 大 小 等 
于 一 个 记录 大 小 。 请 用 P、V 操作 来 保证 文件 的 正确 打印 。 

31. 桌 上 有 一 个 空 盘 , 人 允许 存放 一 只 水 果 。 爸 爸 可 向 盘 中 放 革 果 , 也 可 向 盘 中 放 橘 子 。 
儿子 专 等 吃 盘 中 的 橘子 ,女儿 专 等 吃 盘 中 的 苹果 。 规 定 当 盘 中 空 时 一 次 只 能 放 一 只 水 果 供 
吃 者 取 用 。 请 用 P、V 原 语 实现 爸爸 女儿、 儿子 三 个 并 发 进程 的 同步 关系 。 

32， 有 一 个 阅览 室 , 共 有 100 个 座位 。 读 者 进入 时 必须 先 在 一 张 表 上 登记 ,该 登记 表 每 
一 座位 列 一 表 目 ,包括 座 号 和 读者 姓名 。 读 者 离开 时 要 消 掉 登记 内 容 。 试 用 P、V 原 语 描 述 
读者 进程 间 的 同步 关系 。 

33. Linux 进程 有 哪儿 种 基本 状态 ? 各 个 状态 是 如 何 转换 的 ? 

34，Linux 中 如 何 创 建 进程 ”创建 进程 时 需要 做 哪些 工作 ? 

35, 编写 一 个 程序 ,使 用 系统 调用 fork() 生 成 3 个 子 进程 ,并 使 用 系统 调用 pipe() 创 建 
一 个 管道 ,使 得 这 3 个 子 进程 和 父 进程 共用 一 个 管道 进行 通信 。 
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处 理 机 调度 与 死 锁 


处 理 机 是 系统 中 的 重要 资源 之 一 , 它 的 利用 率 及 系统 性 能 (吞吐 量 、 响 应 时 间 ) 在 很 大 程度 
上 取决 于 处 理 机 调度 性 能 的 好 坏 , 因 而 ,处 理 机 调度 便 成 为 操作 系统 设计 的 中 心 问题 之 一 。 

在 多 道 程序 环境 下 ,使 多 个 进程 并 发 运行 ,共享 系统 资源 ,从 而 提高 了 系统 的 资源 利用 
率 。 但 是 若 对 资源 管理 和 使 用 不 当 , 在 一 定 条件 下 会 发 生 一 种 危险 现象 一 死 锁 。 

本 章 重点 介绍 单 处 理 机 调度 中 的 进程 调度 和 作业 调度 ,包括 调度 时 机 、 调 度 常用 算法 和 
对 各 种 算法 的 评价 ,最 后 介绍 死 锁 的 概念 和 解决 死 锁 的 常用 方法 。 


@.1 调度 的 基本 概念 


处 理 机 调度 实际 上 是 处 理 机 分 配 问题 。 在 多 道 程序 系统 中 ,一 个 作业 被 提交 后 ,必须 经 
过 处 理 机 调度 后 , 方 能 获得 处 理 机 而 执行 。 在 批 处 理 系 统 中 ,处 于 执行 状态 下 的 作业 一 般 包 
含 多 个 进程 ; 在 分 时 系统 中 ,同时 有 多 个 终端 进程 ; 而 在 单 处 理 机 系统 中 ,每 一 时 刻 只 能 有 
一 个 进程 占有 处 理 机 。 因 此 ,如 何 从 众多 的 就 绪 进 程 中 挑选 一 个 进程 ,使 之 得 到 处 理 机 而 执 
行 呢 ? 这 就 需要 有 一 定 的 方法 和 策略 为 这 些 进 程 分 配 处 理 机 。 


4.1.1 作业 的 概念 及 作业 的 状态 
1. 作业 的 概念 


在 一 次 应 用 业务 处 理 过 程 中 ,从 输入 开始 到 输出 结束 ,用 户 要 求 计 算 机 所 做 的 有 关 该 次 
业务 处 理 的 全 部 工作 为 一 个 作业 。 例 如 ,用 程序 设计 语言 编制 一 个 程序 ,系统 要 完成 如 下 工 
作 : 编辑 编译、 链接 执行。 以 上 几 个 步骤 的 总 和 就 是 一 个 作业 。 

作业 是 早期 批 处 理 系 统 引 入 的 一 个 概念 。 分 时 用 户 在 一 次 登录 后 所 进行 的 交互 序列 也 
常 被 看 做 是 一 个 作业 。 一 般 来 说 ,作业 是 比 进程 还 大 的 一 个 概念 ,一 个 作业 通常 包含 多 个 计 
算 步骤 ,作业 中 一 个 相对 独立 的 处 理 步骤 称 为 一 个 作业 步 。 各 个 作业 步 是 相互 独立 又 相互 
关联 的 ,一 般 来 说 ,每 一 个 作业 步 产生 下 一 个 作业 步 的 输入 文件 。 一 个 作业 步 的 划分 与 具体 
的 作业 和 操作 系统 有 关 。 例 如 ,有 的 高 级 语言 编译 后 得 到 的 不 是 目标 代码 而 是 汇编 语言 源 
程序 ,那么 编译 后 还 要 增加 一 个 汇编 作业 步 。 

作业 由 程序 ,数据 和 作业 说 明 书 组 成 。 系统 通 过 作业 说 明 书 控制 文件 形式 的 程序 和 数 
据 , 使 之 执行 和 操作 。 一 个 作业 至 少 包含 一 个 程序 。 作 业 中 包含 的 程序 和 数据 用 于 完成 用 
户 所 要 求 的 业务 处 理工 作 。 作 业 说 明 书 则 体现 用 户 的 控制 意图 。 通 过 作业 说 明 书 ,在 系统 
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中 将 生成 一 个 称 为 作业 控制 块 (JCB) 的 表 。 该 表 登 记 该 作业 所 要 求 的 资源 情况 、 预 计 执行 
时 间 和 执行 优先 级 等 。 操 作 系 统 通过 该 表 了 解 到 作业 的 要 求 ,并 分 配 资源 和 控制 作业 中 程 
序 和 数据 的 编译 、 链 接 、 装 入 和 执行 等 。 

一 般 而 言 ,作业 说 明 书 方式 主要 用 在 批 处 理 系 统 中 , 且 各 计算 机 厂家 对 自己 的 系统 定义 
有 各 自 的 作业 说 明 书 的 格式 和 内 容 。 在 微机 和 工作 站 系统 中 ,人 们 常用 批 处 理 文件 或 Shell 
程序 方式 编写 作业 说 明 书 。 


2. 作业 的 状态 


与 进程 的 状态 变换 类 似 , 一 个 作业 从 进入 系统 到 运行 结束 ,一 般 要 经 过 3 个 阶段 ,对 应 
“后 备 “ 执 行 “ 完 成 ”3 个 状态 ,如 图 4-1 所 示 。 
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图 4-1 作业 的 状态 及 其 转换 


1) 后 备 状态 

用 户 通过 某 种 输入 设备 将 作业 从 外 部 输入 到 外 存 中 的 过 程 称 为 提交 过 程 。 当 作业 的 全 
部 信息 进入 外 存 之 后 ,系统 为 之 建立 一 个 作业 控制 块 ,标志 着 作业 的 生命 周期 开始 。 在 作业 
提交 完成 ,未 开始 运行 之 前 这 一 阶段 ,作业 处 于 后 备 状 态 。 外 存 中 所 有 的 后 备 作 业 组 成 一 个 
后 备 队列 ,等 待 作业 调度 程序 选中 。 

2) 执行 状态 

从 一 个 位 于 后 备 队列 的 作业 被 作业 调度 程序 选中 调 入 内 存 ,直到 作业 的 功能 完成 这 一 
阶段 ,作业 处 于 执行 状态 。 需 要 指出 的 是 ,从 宏观 上 看 ,作业 处 于 执行 状态 ,但 是 由 于 作业 的 
主 进程 又 可 以 建立 若干 子 进程 ,同时 ,作业 调度 程序 可 以 在 一 段 时 间 内 选中 多 个 作业 投入 运 
行 , 所 以 ,从 微观 上 看 ,在 某 一 时 刻 , 到 底 是 哪 一 个 作业 的 哪 一 个 进程 在 处 理 机 上 执行 , 则 由 
进程 调度 程序 决定 。 

3) 完成 状态 

当 一 个 作业 正常 终止 或 者 因 出 错 而 中 途 停止 时 ,作业 就 处 于 完成 状态 。 在 这 一 阶段 , 操 
作 系 统 回 收 该 作业 所 占用 的 资源 ,给 出 作业 的 执行 结果 ,同时 执行 作业 调度 程序 选取 新 的 作 
业 执 行 。 作 业 的 输出 结果 可 以 在 作业 结束 时 直接 输出 ,也 可 以 以 输出 文件 的 方式 送 入 外 存 
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设备 , 稍 后 采用 脱 机 方式 输出 。 
作业 调度 就 是 处 理 这 3 种 状态 之 间 的 转换 。 要 注意 ,在 有 的 操作 系统 中 ,除了 上 述 3 种 
作业 状态 外 ,还 设置 了 其 他 作业 状态 。 


4.1.2 分 级 调度 


一 个 批 处 理 系统 中 的 作业 ,从 进入 系统 并 驻 留 在 外 存 的 后 备 队列 中 开始 ,直到 作业 运行 
完成 ,可 能 要 经 过 多 级 调度 才能 完成 。 





1. 作业 调度 


作业 调度 又 称 宏观 调度 或 高 级 调度 。 其 主要 任务 是 按 一 定 的 算法 从 后 备 作业 队列 中 
选中 一 个 或 一 批 作业 调 入 内 存 , 并 为 之 分 配 内 存 等 必要 的 资源 ,创建 相应 的 进程 ,以 使 该 
作业 获得 竞争 处 理 机 的 权利 ; 当 作业 执行 完成 时 ,还 负责 回收 系统 资源 。 由 于 一 个 系统 
中 可 以 有 多 个 作业 同时 运行 ,一 个 作业 中 又 可 以 有 多 个 进程 , 故 一 个 作业 在 宏观 上 处 于 
运行 状态 ,在 微观 上 , 究 竞 哪 个 作业 的 哪个 进程 能 真正 获得 处 理 机 而 执行 ,要 由 进程 调度 

对 于 批 处 理 系统 ,作业 进入 系统 后 , 先 驻 留 在 外 存 中 ,因此 ,需要 由 作业 调度 将 它们 
分 批 地 装 入 内 存 。 而 在 分 时 系统 中 ,为 了 做 到 及 时 响应 ,用 户 通过 键盘 输入 的 命令 或 数 
据 等 都 直接 送 入 内 存 , 因 而 无 须 配 置 作业 调度 机 制 。 类 似 地 ,在 实时 系统 中 ,通常 也 不 需 
要 作业 调度 。 

2. 交换 调度 


为 了 提高 内 存 利用 率 和 系统 吞吐 量 , 引 入 了 交换 调度 ,也 称 为 中 级 调度 。 其 主要 任务 是 
按照 给 定 的 策略 ,将 处 于 内 存 中 暂时 不 和 运行 的 进程 的 部 分 或 全 部 代码 与 数据 调 至 外 存 交 换 
区 中 ,此 时 ,进程 处 于 静止 状态 。 当 这 些 进 程 重新 具备 运行 条 件 时 ,由 交换 调度 决定 将 哪些 
进程 重新 调 入 内存, 这 一 过 程 也 称 为 激活 ,进程 这 时 处 于 活动 状态 。 因 此 ,在 引入 交换 调度 
的 系统 中 ,进程 的 就 绪 状 态 分 为 静止 就 绪 和 活动 就 绪 , 等 待 状态 分 为 静止 等 待 和 活动 等 待 。 
交换 调度 主要 涉及 内 存 管理 ,将 在 第 5 章 中 做 详细 介绍 。 


3. 进程 调度 

进程 调度 又 称 微观 调度 或 低级 调度 。 其 主要 任务 是 按照 某 种 策略 和 方法 选取 一 个 就 绪 
状态 的 进程 占用 处 理 机 。 在 确定 了 占用 处 理 机 的 进程 之 后 ,系统 必须 进行 进程 上 下 文 切换 
以 建立 与 占用 处 理 机 进程 相 适 应 的 环境 。 

4. 线程 调度 


线程 调度 与 进程 调度 类 似 ,选择 一 个 就 绪 状 态 的 线程 进入 执行 状态 。 与 进程 调度 不 同 
的 是 ,线程 上 下 文 切换 比 进程 上 下 文 切换 速度 快 。 

在 多 用 户 系统 中 都 涉及 进程 的 调度 ,但 其 他 的 调度 则 并 不 是 所 有 的 系统 都 具有 ,通常 与 
操作 系统 的 设计 目标 有 关 。 
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4.1.3 调度 的 功能 与 时 机 
1. 作业 调度 的 功能 与 时 机 


作业 调度 由 作业 调度 程序 处 理 的 , 它 本 身 作为 一 个 系统 进程 执行 ,这 个 进程 在 系统 初始 
化 时 就 已 经 建立 了 。 作 业 调 度 程序 主要 完成 作业 从 后 备 状态 到 执行 状态 的 转变 ,以 及 从 执 
行 状 态 到 完成 状态 的 转变 。 一 般 来 说 ,一 个 作业 调度 程序 应 完成 下 述 功 能 : 

(1) 记录 系统 中 各 作业 的 状况 。 为 了 对 作业 进行 管理 ,系统 必须 掌握 作业 在 各 个 阶段 
的 有 关 情 况 。 通 常 , 当 作 业 进入 后 备 状态 之 后 ,系统 为 它 建立 一 个 对 应 的 JCB 记录 有 关 的 
信息 。 作 业 调 度 程序 根据 JCB 中 的 内 容 对 作业 进行 管理 和 控制 。 为 此 ,作业 调度 程序 必须 
记录 系统 中 各 作业 中 的 状况 ,例如 ,登记 作业 的 描述 信息 、 作 业 的 执行 时 间 ,查询 当前 作业 的 
状态 ,等 等 。 

(2) 按照 一 定 的 算法 从 后 备 作业 队列 中 选 出 一 个 或 多 个 作业 投入 运行 。 

(3) 为 被 选中 的 作业 建立 相应 的 主 进程 ,并 为 它 分 配 运行 所 需 的 系统 资源 ,例如 ,调用 
内 存 分 配 程序 为 它 分 配 内 存 , 调 用 外 存 分 配 程序 为 它 分 配 外 存 , 等 等 。 

(4) 在 作业 执行 完毕 时 ,释放 并 回收 该 作业 占用 的 资源 ,撤销 该 作业 ,并 选取 新 的 作业 
执行 调度 过 程 。 

一 般 来 说 ,在 下 列 情况 下 将 启动 作业 调度 : 

(1) 设 m 为 系统 支持 的 在 主机 上 运行 的 最 大 作业 数 ( 也 称道 数 ),n 为 在 主机 上 运行 的 
当前 作业 数 , 如 果 nn 二 m, 且 存在 后 备 作 业 , 则 启动 作业 调度 。 

(2) 当 一 个 作业 终止 而 被 撤销 后 ,如 果 存 在 后 备 作 业 。 则 启动 作业 调度 。 


2. 进程 调度 的 功能 和 时 机 


进程 调度 由 进程 调度 程序 完成 ,进程 调度 以 原 语 的 形式 为 进程 服务 。 进 程 调度 程序 的 
主要 功能 如 下 : 

(1) 将 进程 排队 。 进 程 调度 模块 通过 PCB 来 掌握 系统 中 所 有 进程 的 执行 情况 和 状态 
特征 ,并 在 适当 的 时 机 从 就 绪 队 列 中 选择 一 个 进程 占用 处 理 机 。 因 此 ,为 了 给 进程 调度 
作 准 备 ,进程 调度 模块 根据 各 进程 的 状态 特征 和 资源 要 求 , 将 各 进程 的 PCB 排 成 相应 的 
队列 。 

(2) 选择 占用 处 理 机 的 进程 。 按 照 一 定 的 策略 选择 一 个 处 于 就 绪 状 态 的 进程 ,为 其 分 
选 配 处 理 机 。 

(3) 进行 进程 上 下 文 切换 。 一 个 进程 的 上 下 文 包括 进 程 的 状态 有关 变 量 和 数据 结构 
的 值 、 硬 件 寄 存 器 的 值 和 PCB 以 及 有 关 程 序 等 。 一 个 进程 是 在 进程 的 上 下 文中 执行 的 。 当 
正在 执行 的 进程 由 于 某 种 原因 要 让 出 处 理 机 时 ,系统 要 做 进程 上 下 文 切 换 ,以 使 男 一 个 进程 
得 以 执行 。 当 进行 进程 上 下 文 切换 时 ,首先 检查 是 否 允 许 做 上 下 文 切换 (在 有 些 情况 下 ,上 
下 文 切换 是 不 允许 的 ,例如 系统 正在 执行 某 个 不 允许 中 断 的 原 语 时 ) ,如 果 允 许 , 系 统 将 保 
留 有 关 的 信息 ,以 便 以 后 换 回 该 进程 时 能 恢复 该 进程 的 上 下 文 。 在 系统 保留 了 有 关 的 信 
息 之 后 ,调度 程序 从 就 绪 队 列 中 选择 一 个 进程 ,装配 该 进程 的 上 下 文 , 使 选中 的 进程 得 以 
执行 。 
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一 个 进程 在 CPU 上 的 一 次 连续 执行 过 程 称 为 该 进程 的 一 个 CPU 周期 。 当 进程 需 等 
待 菜 个 事件 而 进入 等 待 态 时 , 便 终止 了 一 个 CPU 周期 。 当 等 待 的 事件 发 生 后 ,进程 将 开始 
下 一 个 CPU 周期 。 进 程 执行 完毕 进入 停止 状态 , 则 终止 了 它 的 最 后 一 个 CPU 周期 。 一 个 
进程 在 其 生命 周期 中 ,通常 有 若干 个 离散 的 且 长 短 不 等 的 CPU 周期 。 例 如 ,一 个 进程 需要 
在 CPU 上 执行 的 总 时 间 为 1s, 在 100ms、450ms、600ms 的 执行 点 处 分 别 要 等 待 3 个 件 事 件 
而 暂停 执行 , 即 该 进程 有 4 个 分 别 为 100ms、350ms、150ms、400ms 的 CPU 周期 。 当 现行 进 
程 执行 完 它 的 一 个 CPU 周期 时 ,系统 应 及 时 把 CPU 转交 给 另 一 个 进程 去 执行 它 的 CPU 
周期 ,这 是 导致 进程 调度 的 基本 原因 。 

进程 调度 的 方式 主要 有 两 种 : 剥夺 式 和 非 剥 夺 式 。 在 剥夺 方式 下 ,就绪 队列 中 一 旦 有 
进程 的 优先 级 高 于 当前 正在 执行 的 进程 的 优先 级 时 , 便 立 即 发 生 进 程 调度 ,转让 处 理 机 。 
即 , 当 一 个 进程 正在 执行 它 的 一 个 CPU 周期 期 间 , 系 统 强行 剥夺 现行 进程 正 占 用 的 CPU， 
并 把 CPU 分 配给 另 一 个 进程 。 在 采用 剥夺 方式 的 调度 系统 中 ,一 个 进程 的 CPU 周期 可 能 
被 分 割 成 两 个 或 多 个 CPU 周期 。 而 非 剥 夺 方 式 下 ,一 个 进程 一 旦 获得 处 理 机 便 一 直 执行 
下 去 ,直到 完成 它 的 当前 CPU 周期 ,系统 才 重新 调度 。 

引起 进程 调度 的 原因 与 进程 调度 方式 有 关 , 主 要 有 以 下 几 类 : 进程 执行 结束 ; 时 间 片 
用 完 ; 执行 中 进程 因 某 种 原因 而 被 阻塞 ; 执行 完 系统 调用 ,系统 返回 用 户 进程 ; 高 优先 级 的 
进程 到 来 。 


4.1.4 调度 原则 与 性 能 衡量 
1. 调度 原则 


在 一 个 操作 系统 的 设计 中 ,应 如 何 选择 调度 方式 和 算法 ,在 很 大 程度 上 取决 于 操作 系统 
的 类 型 和 目标 。 例 如 , 批 处 理 系统 的 主要 目标 是 提高 系统 的 吞吐 量 和 资源 的 利用 率 ,分 时 系 
统 的 主要 目标 是 提供 公平 的 多 路 服务 和 及 时 响应 用 户 。 根 据 不 同 的 系统 目标 ,要 考虑 许多 
相应 的 调度 原则 。 一 般 的 调度 原则 主要 有 以 下 几 点 : 

(1) 公平 。 对 所 有 的 作业 (或 进程 ) 应 该 是 公平 合理 的 ,任何 一 个 作业 的 完成 都 不 能 被 
无 限 延迟 。 

(2) 有 效 。 均 衡 使 用 资源 ,使 CPU 与 外 设 尽量 都 保持 “ 忙 ”的 状态 ,使 设备 有 高 的 利 
用 率 。 

(3) 高 吞吐 量 。 每 天 尽 可 能 多 执行 作业 ,以 提高 系统 的 吞吐 量 。 

(4) 及 时 响应 。 尽 可 能 缩短 用 户 的 响应 时 间 。 

(5) 支持 优先 。 对 于 某 些 紧急 的 作业 (或 进程 ) 应 能 得 到 及 时 的 处 理 。 

然而 这 些 原则 往往 是 互相 冲突 的 , 任 一 调度 算法 要 想 同时 满足 上 述 目标 是 不 可 能 的 。 
例如 ,为 了 提高 吞吐 量 应 优先 考虑 运行 短 作业 ,使 单位 时 间 内 运行 的 作业 数 增加 ,但 这 样 做 
对 那些 估计 运行 时 间 长 的 作业 不 公平 ,使 它们 的 响应 时 间 变 得 非常 长 ; 而 为 了 提高 CPU 的 
利用 率 则 应 优先 考虑 运行 长 作业 ,因为 频繁 的 作业 调度 会 增加 CPU 的 额外 开销 。 因 此 ,在 
选择 调度 算法 时 如 果 考 虑 的 因素 过 多 ,调度 算法 就 会 变 得 非常 复杂 。 其 结果 是 系统 开销 增 
加 ,资源 利用 率 下 降 。 在 实际 设计 算法 时 通常 是 对 各 种 调度 原则 进行 折 中 或 有 所 侧重 ,并 力 
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2. 衡量 调度 算法 优 劣 的 指标 


衡量 一 个 调度 算法 的 优 劣 ,主要 是 看 它 是 否 满足 系统 设计 的 要 求 。 对 于 批 处 理 系统 ,由 
于 主要 用 于 计算 ,对 于 作业 的 周转 时 间 要 求 较 高 。 因 此 ,作业 的 平均 周转 时 间或 平均 带 权 周 
转 时 间 被 作为 作业 衡量 调度 算法 优 劣 的 标准 ; 对 于 分 时 系统 ,外 加 平均 响应 时 间 被 作为 衡 
量 调度 算法 的 优 劣 的 标准 ; 而 对 于 实时 系统 , 则 截止 时 间 的 保证 是 评价 实时 调度 算法 的 重 
要 指标 。 

1) 平均 周转 时 间 

作业 i 从 提交 时 刻 Ts 到 作业 的 完成 时 刻 Te 所 经 历 的 时 间 称 为 该 作业 的 周转 时 间 
Ti;, 即 





T= Ts= Ts 
一 个 作业 的 周转 时 间 说 明 该 作业 在 系统 内 停留 的 时 间 , 因 此 : 
Ti= Tiw+ Ta 


其 中 ,TT 为 作业 的 执行 时 间 ,T; 为 作业 从 后 备 状态 到 执行 状态 的 等 待 时 间 。 
进程 i 从 进入 就 绪 队 列 的 时 刻 Ti 到 完成 本 次 CPU 周期 的 时 刻 Ti 所 经 历 的 时 间 称 为 
该 进程 的 周转 时 间 T;, 即 


RE 
nn 个 被 测定 作业 或 进程 的 平均 周转 时 间 为 
T=137, 


er 
2) 平均 带 权 周转 时 间 
作业 i 或 进程 i 的 带 权 周转 时 间 为 
W; = T/T 
平均 带 权 周转 时 间 为 
二 
3) 响应 时 间 
响应 时 间 是 指 从 用 户 通过 键盘 提交 一 个 请 求 开 始 , 直 至 系统 首次 响应 为 止 的 时 间 。 响 
应 时 间 用 来 评价 分 时 系统 的 性 能 。 
4) 截止 时 间 
截止 时 间 指 某 任务 必须 开始 执行 的 最 迟 时 间或 必须 完成 的 最 迟 时 间 。 截 止 时 间 是 评价 
实时 系统 性 能 的 重要 指标 。 


人 2 调度 算法 


由 前 述 讨论 可 知 , 为 了 满足 不 同 的 设计 目标 ,操作 系统 必须 选择 合适 的 调度 算法 。 目 前 
有 许多 调度 算法 ,有 的 适用 于 作业 调度 .有 的 适用 于 进程 调度 ,有 的 既 适 用 于 进程 调度 又 适 
用 于 作业 调度 。 本 节 介 绍 几 种 常用 的 调度 算法 。 
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4.2.1 先 来 先 服务 算法 


先 来 先 服务 (First Come First Serve, FCFS) 是 一 种 最 简单 的 调度 算法 , 既 可 用 于 作业 
调度 ,也 可 用 于 进程 调度 。 该 算法 按照 作业 到 达 和 进程 就 绪 时 间 的 先后 排 成 一 个 调度 队列 ， 
当 发 生 调度 时 ,从 队 头 选中 一 个 作业 或 进程 运行 。 因 此 ,在 不 考虑 其 他 条 件 的 情况 下 ,从 处 
理 的 角度 来 看 ,FCFS 算法 是 最 适合 的 调度 算法 ,因为 不 论 是 追加 还 是 取出 一 个 队列 元 素 ， 
在 操作 上 都 是 最 简单 的 。 下 面 通过 例子 来 说 明 FCFS 算法 的 调度 过 程 及 其 调度 性 能 。 

例 4-1 在 单 道 作业 多 道 程序 环境 下 ,假定 有 4 道 作 业 ( 或 进程 )1、2、3、4, 它 们 到 达 的 相 
对 时 刻 、 运 行 时 间 ( 单 位 为 ms, 即 本 次 CPU 周期 ) 都 已 知 ,如 表 4-1 中 的 第 二 、 三 列 所 示 。 给 
出 采用 FCFS 算法 时 这 4 道 作 业 ( 进 程 ) 的 调度 顺序 以 及 它们 的 平均 周转 时 间 和 平均 带 权 周 
转 时 间 。 调 度 时 间 忽略 不 计 。 

解 : 由 题 知 ,作业 到 达 的 先后 顺序 为 1.2、3、4, 因 此 ,按照 FCFS 算法 的 调度 策略 ,4 道 
作业 (进程 ) 的 调度 顺序 是 1、2、3、4, 也 可 推算 出 每 道 作 业 ( 进 程 ) 的 开始 执行 时 间 、 完 成 时 
间 、 周 转 时 间 , 带 权 周 转 时 间 , 如 表 4-1 中 第 4 一 7 列 所 示 。 

表 4-1 FCFS 算法 下 作业 的 运行 情况 


作业 号 到 达 时 刻 /ms ”运行 时 间 /ms 开始 时 间 /ms 完成 时 间 /ms 周转 时 间 /ms 带 权 周 转 时 间 





和 0 10 0 10 10 灿 
2 1 5 10 15 14 2.8 
3 5 1 15 16 1 1 
4 10 2 16 18 8 4 


平均 周转 时 间 T==10.75ms, 平 均 带 权 周转 时 间 机 一 4.7。 

从 表 4-1 中 可 以 看 出 ,其 中 短 作 业 3 的 带 权 周转 时 间 为 11, 而 长 作业 2 的 带 权 周转 时 间 
只 有 2.8。 因 此 ,FCFS 算法 具有 如 下 的 优 缺点 。 

优点 : 实现 简单 ,有 利于 长 作业 和 CPU 繁忙 的 进程 (很 少 请 求 IO 的 进程 ) 。 

缺点 : 使 短 作 业 等 待 长 作业 ,重要 的 作业 等 待 可 能 不 是 很 重要 的 长 作业 ,因而 不 利于 短 
作业 和 紧迫 的 作业 或 进程 ,不 能 用 于 分 时 和 实时 系统 。 

FCFS 算法 在 实际 使 用 中 很 少 单独 使 用 ,而 是 和 其 他 算法 结合 使 用 。 


4.2.2 短 作 业 优 先 算法 


短 作 业 优先 (Shortest First,SF) 算 法 就 是 选择 估计 运行 时 间 最 短 的 作业 或 本 次 CPU 
周期 最 短 的 进程 执行 。 以 例 4-1 中 给 出 的 4 道 作业 (进程 ) 为 例 来 说 明 SF 算法 的 调度 过 程 
及 其 调度 性 能 。 

例 4-2 对 于 表 4-1 的 前 3 项 ,给 出 采用 SF 调度 算法 时 这 4 道 作业 (进程 ) 的 调度 顺序 
以 及 它们 的 平均 周转 时 间 和 平均 带 权 周转 时 间 。 调 度 时 间 忽 上 略 不 计 。 

解 : 采用 SF 算法 时 ,作业 1 运行 结束 时 ,其 他 3 个 作业 已 进入 后 备 状态 ,此 后 , 按 作 业 
运行 时 间 的 长 短 , 先 后 按 作业 3、 作 业 4、 作 业 2 的 次 序 调度 运行 。 它 们 的 运行 情况 如 表 4-2 
所 示 。 
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表 4-2 SF 算法 下 作业 的 运行 情况 
作业 号 “到达 时 刻 /ms ”运行 时 间 /ms 开始 时 间 /ms 完成 时 间 /ms 周转 时 间 /ms ” 带 权 周转 时 间 








1 0 10 0 10 10 Y 
2 1 5 13 18 17 3.4 
3 5 1 10 11 6 6 
4 10 2 11 13 3 1.5 





平均 周转 时 间 了 一 9ms, 平 均 带 权 周转 时 间 W 二 2. 975。 

比较 本 例 和 例 4-1, 可 以 看 出 ,采用 SF 算法 后 ,这 组 作业 的 平均 周转 时 间 和 平均 带 权 周 
转 时 间 都 比 FCFS 算法 有 较 明 显 的 改善 ,因此 ,对 于 这 组 作业 ,SF 算法 要 优 于 FCFS 算法 。 

SF 算法 具有 如 下 的 优 缺 点 。 

优点 : 有 利于 短 作业 或 短 进程 。 可 使 系统 在 同一 时 间 内 处 理 的 作业 或 进程 个 数 最 多 ， 
从 而 降低 了 作业 的 平均 等 待 时 间 ,提高 了 系统 的 吞吐 量 。 

缺点 : 由 于 作业 (进程 ) 的 长 短 只 是 根据 用 户 提 供 的 估计 执行 时 间 而 定 的 ,而 用 户 又 可 
能 有 意 或 无 意 地 缩短 作业 的 估计 执行 时 间 , 致 使 该 算法 不 一 定 能 真正 做 到 短 作业 优先 。 另 
外 ,SF 算法 不 利于 长 作业 ,不 能 满足 紧迫 作业 ,对 于 一 个 不 断 进 入 短 作业 的 批 处 理 系统 来 
说 ,SF 算法 可 能 使 那些 长 作业 永远 得 不 到 执行 。SF 算法 同样 不 能 保证 对 用 户 的 及 时 响应 。 

SF 算法 适合 于 运行 时 间 可 预知 的 批 作业 调度 ,例如 ,保险 公司 每 天 做 类 似 的 工作 ,可 以 
相当 准确 地 预测 一 个 处 理 100 起 索赔 的 作业 需要 多 长 时 间 。 


4.2.3 最 高 响应 比 优先 算法 


最 高 响应 比 优先 (Highest Response ratio Next, HRN) 算 法 是 对 FCFS 算法 和 SF 算法 
的 一 种 综合 平衡 。FCFS 算法 只 考虑 每 个 作业 的 等 待 时 间 而 未 考虑 执行 时 间 的 长 短 ,SF 算 
法 只 考虑 执行 时 间 而 未 考虑 作业 的 等 待 时 间 的 长 得。 因此 ,这 两 种 调度 算法 的 缺点 处 于 两 
个 极端 。HRN 算法 同时 考虑 每 个 作业 的 等 待 时 间 和 估计 执行 时 间 的 长 短 。 

一 个 进程 或 作业 的 响应 比 R 定义 为 

R= 二 响应 时 间 / 需 运行 的 时 间 三 1 十 已 等 待 的 时 间 / 需 运行 的 时 间 

HRN 调度 算法 每 次 从 后 备 队列 中 选中 响应 比 R 的 值 最 大 的 作业 执行 。 仍 以 例 4-1 中 
的 4 道 作 业 为 例 来 说 明 HRN 算法 的 调度 过 程 及 其 调度 性 能 。 

例 4-3 对 于 表 4-1 的 前 3 项 ,给 出 采用 HRN 调度 算法 时 这 4 道 作业 (进程 ) 的 调度 顺 
序 以 及 它们 的 平均 周转 时 间 和 平均 带 权 周转 时 间 。 调 度 时 间 忽 上 略 不 计 。 

解 : 采用 HRN 算法 时 ,4 道 作 业 ( 进 程 ) 的 调度 顺序 是 1、3、2、4, 它 们 的 运行 情况 如 
表 4-3 所 示 。 作 业 1 运行 结束 时 ,其 他 3 个 作业 已 进入 后 备 状态 ,此 时 ,为 了 确定 到 底 要 选 
择 哪 一 个 作业 执行 , 需 计 算 后 备 队列 中 每 个 作业 的 响应 比 。 作 业 2 的 响应 比 Ra 三 1 十 
(10 一 1)/5 二 2. 8, 作 业 3 的 响应 比 Ri 二 1 十 (10 一 5)/1==6, 作 业 4 的 响应 比 Ru 二 1 十 (10 一 
10)/2 二 1。 因 此 ,作业 3 的 响应 比 最 高 ,选中 作业 3 执行 。 在 作业 3 执行 完成 时 , 需 计算 作 
业 2 和 作业 4 的 响应 比 (注意 ,此 时 每 道 作业 的 响应 比 已 改变 )。 此 时 ,作业 2 的 响应 比 
R2 王 1 十 (11 一 1)7/5 王 3, 作 业 4 的 响应 比 Ra 二 1 十 (11 一 10)/2 二 1.5。 选 中 响应 比 高 的 作业 
2 执行 。 在 作业 2 执行 完成 后 ,再 选中 作业 4 执行 。 
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表 4-3 HRN 算法 下 作业 的 运行 情况 
作业 号 到 达 时 刻 /ms ”运行 时 间 /ms 开始 时 间 /ms 完成 时 间 /ms 周转 时 间 /ms ” 带 权 周转 时 间 








1 0 10 0 10 10 和 
2 1 5 11 16 15 3 
3 5 1 10 11 6 6 
4 10 2 16 18 8 4 





平均 周转 时 间 了 一 9. 75ms ,平均 带 权 周转 时 间 W 二 3. 5。 

可 见 , HRN 算法 的 调度 性 能 介 于 FCFS 算法 和 SF 算法 之 间 。 它 具有 如 下 的 优 缺 点 。 

优点 : 响应 比 R 与 作业 需 运 行 时 间 成 反比 , 故 短 作业 或 短 进程 可 获得 较 高 的 响应 比 ; 
男 一 方面 RR 与 作业 的 等 待 时 间 成 正比 , 故 长 作业 或 长 进程 随 着 其 等 待 时 间 的 增长 也 可 获得 
较 高 的 响应 比 。 因 此 ,HRN 既 照顾 了 短 作 业 ,也 考虑 了 长 作业 。 

缺点 : 每 次 进行 调度 前 都 要 进行 响应 比 计 算 , 会 增加 系统 的 开销 ; 不 能 满足 紧迫 作业 
或 进程 的 需要 。 


4.2.4 高 优先 权 优先 算法 


为 了 使 紧迫 型 作业 或 进程 在 进入 系统 后 便 可 获得 优先 处 理 , 引 入 了 高 优先 权 优先 
(High Priority First,HPF) 算 法 。 当 发 生 调 度 时 ,调度 程序 将 选择 当前 优先 级 最 高 的 后 备 
作业 或 就 绪 进 程 。HPF 是 一 种 广泛 使 用 的 调度 算法 , 它 常 常 作为 批 处 理 系统 的 作业 调度 算 
法 ,也 可 作为 多 种 操作 系统 的 进程 调度 算法 ,还 可 用 于 实时 系统 中 。 

HPF 算法 的 核心 是 优先 级 的 确定 。 优 先 级 通常 用 一 个 整 型 数 来 表示 , 称 为 优先 数 。 对 
于 不 同 的 系统 , 既 可 以 用 较 大 的 数 也 可 以 用 较 小 的 数 来 表示 较 高 的 优先 级 。 例 如 ,UNIX 中 
的 优先 数 的 范围 为 一 128 一 十 127, 且 规定 优先 数 越 小 其 表示 的 优先 级 越 高 。 

优先 级 的 设置 分 为 静态 和 动态 两 种 方式 : 

(1) 静态 设置 方式 。 在 一 个 作业 或 进程 被 建立 时 就 为 它 确定 一 个 优先 级 , 它 在 作业 或 
进程 的 整个 生命 周期 内 保持 不 变 。 一 个 作业 可 由 用 户 根据 作业 的 紧迫 程度 输入 一 个 适当 的 
优先 级 。 为 防止 各 用 户 都 将 自己 的 作业 冠 以 高 优先 级 ,系统 应 对 高 优先 级 用 户 收 取 较 高 的 
费用 。 也 可 由 系统 或 操作 员 根 据 作业 的 类 型 .作业 对 资源 的 要 求情 况 来 确定 优先 级 。 

进程 的 优先 级 则 由 系统 根据 进程 的 类 型 来 确定 。 一 般 来 说 ,系统 进程 优先 级 要 高 于 用 
户 进 程 ; 而 对 于 I/O 繁忙 型 的 进程 ,其 大 多 数 时 间 用 来 等 待 1/O 结束 ,使 这 类 进程 长 时 间 等 
待 CPU 只 会 使 它 无 谓 地 长 时 间 占 用 内 存 ,因此 ,通常 I/O 繁忙 型 进程 的 优先 级 高 于 计算 型 
进程 的 优先 级 ,以便 在 启动 一 个 LO 操作 后 ,就 可 以 启动 一 个 计算 进程 。 也 可 根据 进程 对 
资源 的 要 求 确定 优先 级 ,如 进程 对 内 存 的 需求 量 的 多 少 和 进程 的 估计 执行 时 间 等 。 

(2) 动态 设置 方式 。 在 创建 一 个 进程 时 ,根据 该 进程 的 基本 特征 为 其 设置 一 个 初始 的 
优先 级 ,此 后 随 着 进程 特性 和 运行 环境 的 变化 而 动态 地 改变 其 优先 级 。 例 如 ,使 进程 的 优先 
级 随 着 其 等 待 使 用 CPU 时 间 的 增长 而 提高 , 随 着 其 占用 CPU 时 间 的 增长 而 降低 。 这 样 ， 
即使 是 低 优先 级 的 进程 ,也 会 在 等 了 足够 的 时 间 后 ,使 其 优先 级 提高 而 得 到 执行 。 而 对 于 高 
优先 级 的 进程 , 随 着 进程 占用 CPU 时 间 的 增长 ,其 优先 级 会 逐渐 下 降 , 因 而 可 防止 一 个 长 
进程 长 时 间 占 用 处 理 机 。 
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HPF 算法 可 以 是 剥夺 式 或 非 剥 夺 式 的 。 在 剥夺 方式 下 ,系统 将 保证 在 任何 时 刻 现 行进 
程 的 优先 级 不 低 于 任 一 就 绪 进 程 , 因 此 一 旦 出 现 了 比 现 行进 程 具有 更 高 优先 级 的 就 绪 进 程 ， 
便 立 即 实施 剥夺 。 而 在 非 剥 夺 方 式 下 ,只 有 等 现行 进程 的 当前 CPU 周期 结束 后 才 重新 调 
度 。 显 然 ,剥夺 式 HPF 算法 更 能 体现 优先 级 的 意义 ,使 得 高 优先 级 进程 能 够 尽快 地 完成 它 
的 任务 ,但 无 疑 也 增加 了 一 定 的 系统 开销 。 

下 面 通过 一 个 例子 考察 HPF 进程 调度 的 执行 过 程 及 其 调度 性 能 。 

例 4-4 假定 有 4 个 就 绪 进程 ,它们 进入 就 绪 队 列 的 相对 时 刻 、 各 自 的 本 次 CPU 周期 长 
度 及 初始 优先 数 如 表 4-4 所 示 。 在 此 ,规定 小 的 优先 数 表示 高 的 优先 级 ,调度 时 间 忽 略 
不 计 。 





表 4-4 4 个 进程 的 CPU 周期 长 度 及 初始 优先 数 











进程 到 达 时 刻 /ms CPU 周期 /ms 优先 数 
pi 0 22 4 
pz 0 8 2 
ps 0 4 5 
p 18 10 3 


(1) 给 出 采用 非 剥夺 静态 设置 方式 HPF 算法 时 4 个 进程 的 平均 周转 时 间 及 平均 带 权 
周转 时 间 。 

(2) 给 出 采用 剥夺 动态 设置 方式 HPF 调度 算法 时 4 个 进程 的 平均 周转 时 间 及 平均 带 
权 周 转 时 间 。 假 设 现行 进程 每 连续 执行 10ms 以 上 其 优先 数 加 1( 即 降低 优先 级 ) ,而 就 绪 进 
程 每 20ms 后 其 优先 数 减 1( 即 提高 优先 级 ) 。 

解 : (1) 在 非 剥 夺 静 态 设置 方式 下 ,执行 情况 如 图 4-2 所 示 。 在 相对 0 时 刻 , 就 绪 队 列 
中 有 进程 p .ps 和 ps ,进程 ps 的 优先 数 最 小 ,优先 级 最 高 ,因而 进程 ps 优先 执行 。 在 ps 执 
行 完 后 ,执行 进程 p ,在 进程 p, 执行 期 间 , 进 程 p, 到 达 , 虽 然 其 优先 级 高 于 进程 pi ,但 是 在 
非 剥 夺 方 式 下 ,只 有 在 当前 正在 执行 的 进程 的 CPU 周期 完成 后 , 才 去 调度 ,因而 在 进程 pi 
执行 完成 后 ,执行 进程 p, ,最 后 执行 进程 py 。 可 以 算出 这 组 进程 的 平均 周转 时 间 T 和 平均 
带 权 周转 时 间 W 分 别 为 

T=26ms W=3.89 














优先 数 2 4 3 5 
进程 Pp2 | pi | ps | ps 
相对 时 刻 /ms 0 8 30 40 44 


4-2 静态 设置 非 剥夺 方式 的 执行 情况 


(2) 在 剥夺 动态 设置 方式 下 ,执行 情况 如 图 4-3 所 示 。 




















优先 数 2 4 i 
进程 [ Pp | p m [mrm| nm 
相对 时 刻 ms 0 8 18 28 32 44 


图 4-3 动态 设置 剥夺 方式 的 执行 情况 
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在 p; 执行 完 后 ,执行 进程 p ,在 进程 p; 执行 到 18ms 时 ,进程 p, 到 达 , 其 优先 级 高 于 进 
程 pi ,剥夺 进程 p 而 执行 进程 pl ,同时 进程 p, 因 连 续 执行 了 10ms 而 优先 数 被 加 1( 变 为 
5); 在 进程 ps 执行 期 间 进 程 ps 因 等 待 了 20ms, 其 优先 数 被 减 1( 变 为 4) ,但 是 此 时 仍然 是 
进程 ps 的 优先 数 最 小 ,接着 执行 进程 p 直到 执行 完毕 (28ms 时 ); 此 时 ps 的 优先 数 小 于 进 
程 pi 的 优先 数 , 于 是 先 执行 ps ,最 后 再 执行 进程 pl 。 可 以 算出 这 组 进程 的 平均 周转 时 间 全 
和 平均 带 权 周转 时 间 W 分 别 为 








T=23.5ms W=3 
从 上 面 的 两 组 平均 周转 时 间 T 和 平均 带 权 周转 时 间 W 数据 中 可 以 看 出 ,在 本 例 中 , 采 
用 动态 优先 级 设置 要 优 于 静态 优先 级 设置 。 因 此 ,HPF 算法 具有 如 下 的 优 缺 点 。 
优点 : 可 以 使 紧迫 的 任务 得 到 优先 执行 。 
缺点 : 静态 优先 级 易于 实现 ,系统 开销 小 ,但 作业 或 进程 的 优先 级 不 够 精确 ,有 可 能 导 
致 某 些 优先 级 较 低 的 进程 长 期 等 待 ; 动态 优先 级 须 计 算 优 先 级 ,增加 系统 的 开销 。 
在 实际 使 用 中 ,优先 级 的 确定 涉及 许多 因素 ,因此 ,往往 和 其 他 算法 结合 使 用 。 


4.2.5 轮转 法 


轮转 法 (Round Robin,RR) 也 称 为 时 间 片 轮转 法 , 它 依 照 公平 对 待 的 原则 ,照顾 到 所 有 
的 进程 ,让 它们 都 有 机 会 得 到 执行 。 

在 RR 算法 的 具体 实现 中 ,系统 将 所 有 的 就 绪 进 程 按照 先 来 先 服务 的 顺序 排 成 一 个 队 
列 ,调度 程序 每 次 选中 队列 中 的 第 一 个 进程 执行 ,并 规定 其 连续 执行 的 时 间 不 能 超过 一 个 给 
定 的 时 间 , 例 如 100ms, 该 时 间 称 为 时 间 片 。 如 果 现 行进 程 的 当前 CPU 周期 的 时 值 小 于 时 
间 片 , 即 分 配给 该 进程 的 时 间 片 还 没有 用 完 , 进 程 因 某 种 原因 转 入 等 待 状态 , 则 重新 调度 ,并 
将 该 进程 插入 到 相应 的 等 待 队列 中 , 当 它 所 等 待 的 事件 发 生 后 , 转 和 就绪 状 态 ,重新 返回 到 
就 绪 队 列 尾 , 等 待 下 一 次 的 执行 ; 如 果 现 行进 程 的 当前 CPU 周期 的 时 值 大 于 或 等 于 时 间 
片 , 即 分 配给 该 进程 的 时 间 片 已 用 完 , 则 将 当前 进程 送 至 就 绪 队 列 尾 等 待 下 一 轮 的 执行 , 同 
时 将 处 理 机 分 配给 就 绪 队 列队 首 的 进程 。 如 此 轮转 调度 ,使 得 所 有 就 绪 进 程 在 一 个 有 限 的 
时 间 周 期 内 都 可 获得 一 次 时 间 片 的 执行 。 因 此 ,RR 算法 特别 适合 于 分 时 系统 ,通过 轮转 调 
度 , 系 统 能 够 及 时 响应 每 个 终端 用 户 的 请 求 。 分 时 系统 提供 了 大 量 的 终端 命令 ,只 要 时 间 片 
值 恰当 ,大 多 数 终端 命令 都 能 在 一 个 时 间 片 内 完成 .因而 在 用 户 可 接受 的 时 间 周 期 内 ,每 个 
用 户 的 一 次 请 求 命 令 都 能 得 到 及 时 的 响应 。 

RR 算法 中 ,一 个 极为 重要 的 问题 是 时 间 片 g 值 的 设置 。 一 个 进程 切换 到 另 一 个 进程 
需要 一 定 的 时 间 。 假 设 进程 切换 需要 花费 5ms ,一 个 系统 的 时 间 片 为 20ms, 则 CPU 在 做 完 
一 个 有 用 的 工作 后 要 花费 5ms 来 进行 进程 切换 ,那么 ,CPU 时 间 的 20% 就 被 浪费 在 管理 开 
销 上 了 。 为 了 提高 CPU 效率 ,可 以 将 时 间 片 设 为 500ms, 这 时 CPU 浪费 的 时 间 为 1%。 但 
是 ,假设 某 一 时 刻 有 10 个 用 户 同时 按 下 回 车 键 , 则 最 后 一 个 用 户 在 5s 后 才 得 到 响应 ,这 对 
多 数 用 户 来 说 不 能 忍受 。 

综 上 所 述 , 若 dg 值 取 得 过 大 ,以 致使 每 个 进程 都 能 在 分 给 它 的 时 间 片 内 完成 , 则 RR 算 
法 就 已 经 退化 成 了 FCFS 算法 ,对 短 进程 的 请 求 交互 响应 变 差 ; 反之 , 若 g 值 取 得 过 小 , 则 
势必 导致 频繁 的 进程 调度 ,增加 了 CPU 的 额外 开销 ,降低 了 CPU 的 有 效 利用 率 。 那 么 ,到 
底 怎样 确定 一 个 系统 的 时 间 片 大 小 呢 ? 
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通常 ,时 间 片 的 大 小 选择 是 根据 系统 对 响应 时 间 上 限 的 要 求 R 和 系统 中 所 允许 的 最 大 

的 就 绪 进 程 数目 N ,确定 的 。 它 可 表示 为 
二 RN 

为 所 有 进程 分 配 固定 时 间 片 的 方法 显然 简单 易 行 ,适合 于 小 型 的 分 时 系统 。 但 是 ,在 时 
间 片 固定 的 情况 下 ,如 果 就 绪 队 列 中 的 进程 数 远 小 于 Ns ,， 则 用 户 的 响应 时 间 看 上 去 会 大 
大 减 小 ,而 实际 上 对 系统 开销 来 说 ,由 于 时 间 片 固定 ,进程 切换 的 时 机 不 变 , 切 换 所 花费 的 时 
间 不 变 , 从 而 系统 开销 不 变 。 

例如 ,假设 时 间 片 为 0. 1ms, 当 就 绪 进 程 zx 一 20 时 ,用 户 和 响应 时 间 为 r=2ms; 当 n=6 
时 ,7 三 0. 6ms。 对 用 户 来 说 ,2ms 的 响应 时 间 和 0. 6ms 的 响应 时 间 并 没有 太 大 的 差别 ,而 系 
统 的 进程 切换 开销 并 没有 减 小 。 倘 若 保 持 响 应 时 间 不 变 ( 为 2ms), 当 ?=6 时 ,时 间 片 变 为 
0.35ms, 显 著 减 少 了 系统 开销 。 因 此 ,为 了 进一步 改善 RR 算法 的 调度 性 能 ,可 采用 可 变 时 
间 片 的 RR 调度 算法 。 一 种 可 行 的 办 法 是 ,每 当 新 的 一 轮 调 度 开 始 时 ,系统 便 根据 就 绪 队 列 
中 已 有 的 进程 数目 计算 一 次 时 间 片 g, 作 为 新 一 轮 调度 的 时 间 片 。 

总 之 ,未 考虑 进程 优先 级 和 进程 特点 的 RR 算法 具有 如 下 的 优 缺 点 : 

优点 : 可 以 使 用 户 得 到 及 时 的 响应 和 服务 。 

缺点 : 由 于 所 有 进程 的 等 待 时 间 是 相同 的 ,这 对 短 进程 用 户 和 I/O 繁忙 型 进程 是 不 利 
的 。 特 别 是 当 紧迫 型 的 进程 到 来 时 ,不 能 及 时 得 到 处 理 。 


4.2.6 多 级 反馈 算法 


多 级 反馈 (Multiple Feedback,MF) 算 法 是 一 种 普遍 应 用 的 进程 调度 算法 。MF 算法 是 
综合 了 FCFS、RR 和 HPF 算法 的 特点 的 一 种 调度 算法 。 它 综合 考虑 了 多 种 因素 ,根据 进程 
行情 况 的 反馈 信息 对 进程 实施 调度 。 如 图 4-4 所 示 , MF 算法 的 实施 过 程 如 下 。 

就 绪 队 列 1 
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运 





















































| 就 结 队列 n 


图 4-4 MF 算法 的 示意 图 


(1) 按 优 先 级 设置 n 个 就 绪 队 列 , 并 为 各 个 队列 赋予 不 同 的 优先 级 。 第 一 个 队列 的 优 
先 级 最 高 ,第 二 个 队列 次 之 ,其 余 各 队列 的 优先 级 逐个 降低 。 该 算法 赋予 各 个 队列 中 进程 执 
行 时 间 片 的 大 小 也 各 不 相同 ,在 优先 级 越 高 的 队列 中 ,为 每 个 进程 所 规定 的 执行 时 间 片 就 越 
小 。 例 如 ,第 二 个 队列 的 时 间 片 要 比 第 一 个 队列 的 时 间 片 长 一 倍 …… 第 ;十 1 个 队列 的 时 间 
片 要 比 第 ;个 队列 的 时 间 片 长 一 倍 。 

(2) 当 一 个 新 进程 进入 内 存 后 ,首先 将 它 放 入 第 一 个 队列 的 末尾 , 按 FCFS 原则 排队 等 
待 调度 。 当 轮 到 该 进程 执行 时 ,如 果 它 能 在 该 时 间 片 内 完成 , 便 可 准备 撤离 系统 ; 如 果 它 在 
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一 个 时 间 片 结束 时 尚未 完成 或 者 被 阻塞 ,调度 程序 便 将 该 进程 转 和 人 第 二 队列 的 末尾 ; 如 果 
它 在 第 二 队列 中 运行 一 个 时 间 片 后 仍 未 完成 ,再 依次 将 它 放 入 第 三 队列 …… 如 此 下 去 。 

(3) 仅 当 一 个 长 进程 从 第 一 个 队列 依次 降 到 第 n 个 队列 后 ,在 第 个 队列 中 便 采取 按 
时 间 片 轮转 的 方式 运行 ,其 余 队 列 均 采 用 FCFS 调度 。 

(4) 系统 每 次 总 是 调度 优先 级 较 高 的 队列 中 的 进程 。 仅 当 第 1 一 :一 1 个 队列 均 为 空 
时 , 才 会 调度 第 i 个 队列 中 的 进程 运行 。 

(5) 如 果 处 理 机 正在 第 i 个 队列 中 为 某 进程 服务 时 ,又 有 新 进程 进入 优先 权 较 高 的 队 
列 (第 1 一 上 一 1 中 的 任何 一 个 队列 ), 则 此 时 新 进程 将 抢占 现行 进程 的 处 理 机 ,将 现行 进程 调 入 
第 i 队列 的 末尾 。 如 果 一 个 进程 被 唤醒 , 它 进 入 原先 离开 的 那个 队列 或 更 高 一 级 的 就 绪 队 列 。 

例如 ,一 个 进程 运行 完成 需要 100 个 时 间 片 ,如 果 采 用 RR 算法 , 则 这 个 进程 需要 切换 
100 次 。 如 果 采 用 MF 算法 ,第 一 次 运行 分 配给 它 一 个 时 间 片 ,第 二 次 分 配给 它 2 个 时 间 
片 , 随 后 依次 为 4 个 、8 个 ……64 个 , 则 这 个 进程 运行 需要 切换 7 次 就 可 完成 ,大 大 提高 了 
CPU 的 使 用 效率 ,同时 随 着 运行 优先 级 的 不 断 降低 , 它 的 运行 频 度 放 慢 , 为 其 他 进程 让 出 了 
CPU。MF 算法 可 以 较 好 地 协调 长 进程 和 短 进程 的 执行 。 

总 之 ,不 论 采用 哪 一 种 调度 算法 ,可 靠 \ 有 效 和 实用 的 调度 算法 是 操作 系统 设计 的 最 终 
目标 。 


人 3 实时 调度 算法 


由 于 前 述 的 调度 算法 都 不 能 很 好 地 满足 实时 系统 的 调度 要 求 ,为 此 , 需 引 入 一 种 新 的 调 
度 , 即 实时 调度 。 而 随 着 计算 机 移动 通信 和 网 络 的 发 展 ,实时 系统 变 得 越 来 越 重 要 。 


4.3.1 实时 系统 的 特点 
1. 实时 任务 的 特点 


实时 任务 有 以 下 几 个 特点 : 

(1) 实时 任务 的 处 理 和 控制 的 正确 性 不 仅 取决 于 计算 结果 的 正确 性 ,而 且 取 决 于 计算 
结果 产生 的 时 间 。 实 时 系统 是 那些 时 间 因 素 非常 关键 的 系统 。 例 如 ,计算 机 的 一 个 或 多 个 
外 设 发 出 信号 ,计算 机 必须 在 一 段 固定 时 间 内 做 出 适当 的 反应 。 一 个 实例 是 ,计算 机 用 
CD-ROM 放 音 乐 时 从 驱动 器 获得 二 进 制 数据 ,并 且 必 须 在 很 短 的 时 间 内 将 其 转换 成 音乐 。 
如 果 其 间 计 算 花 的 时 间 太 长 ,音乐 听 起 来 就 会 失真 ,其 他 实时 系统 还 包括 医院 里 特 护 病房 的 
监控 系统 .飞行 器 中 的 自动 驾驶 仪 以 及 核反应 堆 中 的 安全 控制 系统 等 。 在 这 些 系统 中 ,迟到 
的 响应 即使 正确 ,也 和 没有 响应 一 样 糟糕 。 因 此 ,在 实时 系统 中 每 一 个 要 处 理 的 任务 都 联系 
着 一 个 截止 时 间 。 为 保证 系统 能 正常 工作 ,实时 调度 算法 必须 能 满足 实时 任务 对 截止 时 间 
的 要 求 。 实 时 任务 最 迟 开始 处 理 的 时 间 称 为 开始 截止 时 间 ,实时 任务 最 迟 完成 的 时 间 称 为 
完成 截止 时 间 。 

(2) 根据 对 处 理事 件 的 时 限 要 求 . 实 时 系统 中 处 理 的 外 部 事件 可 分 为 硬 实时 任务 和 软 
实时 任务 。 硬 实时 任务 要 求 系统 必须 完全 满足 任务 的 时 限 要 求 。 软 实时 任务 则 允许 系统 对 
任务 的 时 限 有 一 定 的 延迟 ,其 时 限 要 求 只 是 一 个 相对 的 条 件 。 
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(3) 按 处 理 任务 的 性 质 进 一 步 可 分 为 周期 性 任务 (每 隔 一 段 固 定 的 时 间 发 生 ) 和 非 周 期 
性 任务 (在 不 可 预测 的 时 间 发 生 ) 两 大 类 。 根 据 每 个 事件 需要 的 处 理 时 间 , 一 个 系统 可 能 响 
应 多 个 周期 的 事件 流 ,也 可 能 根本 来 不 及 处 理 所 有 事件 。 例 如 ,有 nn 个 周期 性 事件 ,事件 i 
的 周期 为 P;, 其 中 每 个 事件 需要 C; 秒 的 CPU 时 间 来 处 理 , 则 只 有 满足 以 下 条 件 : 

六 和 < 

才 可 能 处 理 所 有 的 负载 。 满 足 该 条 件 的 实时 系统 称 作 是 可 调度 的 。 例 如 ,一 个 软 实时 系统 
处 理 3 个 事件 流 ,其 周期 分 别 为 100、200 和 500ms。 如 果 事 件 处 理 时 间 分 别 为 50、30 和 
100ms, 则 这 个 系统 是 可 调度 的 ,因为 0.5 十 0.15 十 0. 2 二 1。 如 果 加 入 周期 为 1s 的 第 4 个 事 
件 , 则 只 要 其 处 理 时 间 不 超过 150ms ,该 系统 仍 将 是 可 调度 的 。 这 个 运算 的 隐 含 条 件 是 上 下 
文 切换 的 开销 很 小 ,可 以 忽略 。 


2. 实时 系统 具备 的 能 力 


实时 系统 要 求 很 高 的 可 靠 性 , 当 系统 发 生 错误 时 ,实时 系统 不 能 像 非 实时 系统 那样 , 先 
停止 当前 处 理 的 进程 , 转 去 执行 出 错 处 理 或 重新 启动 系统 。 实 时 系统 要 求 在 系统 出 错时 , 既 
能 够 处 理 所 发 生 的 错误 ,又 不 影响 正在 执行 的 用 户 进程 。 另 外 ,为 了 保证 实时 系统 处 理 的 任 
务 在 有 限 的 时 间 内 处 理 完毕 ,实时 系统 允许 用 户 控制 进程 的 优先 级 并 选择 相应 的 调度 算法 ， 
从 而 对 进程 执行 的 先后 顺序 进行 控制 。 因 此 ,一 个 实时 系统 应 具有 如 下 的 能 力 : 

(1) 快速 的 切换 机 制 。 为 保证 实时 任务 的 及 时 运行 ,实时 系统 的 进程 或 线程 切换 速度 
应 非常 快 。 这 就 要 求 加 强 系统 的 处 理 能 力 ,以 减少 对 每 一 个 任务 的 处 理 时间 。 

(2) 快速 的 外 部 中 断 响 应 能 力 。 为 及 时 响应 外 部 事件 的 中 断 请 求 , 系统 要 具有 快速 的 
硬件 中 断 机 构 ,还 应 使 禁止 中 断 的 时 间 间 隔 尽量 短 。 

(3) 采用 基于 优先 级 的 抢占 式 调度 策略 。 当 一 个 优先 级 更 高 的 任务 到 达 时 ,允许 将 当 
前 任务 暂时 挂 起 ,而 令 高 优先 级 任务 立即 投入 运行 ,以 满足 实时 任务 对 截止 时 间 的 要 求 。 但 
这 种 调度 机 制 比较 复杂 。 对 于 一 些小 型 的 实时 系统 ,如 果 能 预知 任务 的 截止 时 间 , 则 可 采用 
非 抢 占 式 调度 ,以 减少 调度 任务 时 所 花费 的 系统 开销 。 


4.3.2 实时 调度 算法 

实时 调度 算法 可 以 是 动态 的 或 是 静态 的 。 前 者 在 运行 时 做 出 调度 决定 ,后 者 在 系统 启 
动 之 前 完成 所 有 的 调度 决策 。 下 面 介 绍 几 种 常用 的 实时 调度 算法 。 

1. 频率 单调 调度 算法 


频率 单调 调度 (Rate-Monotontic Scheduling,RMS) 算 法 是 面向 周期 性 任务 的 非 抢 占 式 
调度 算法 。 该 算法 的 基本 原理 是 频率 越 低 (周期 越 长 ) 的 任务 优先 级 越 低 。 已 经 证 明 ,RMS 
算法 可 调度 的 充分 条 件 是 

2 中 去 2(2* 一 1) 

例 4-5 有 A、B、C 3 个 周期 性 任务 ,它们 的 发 生 周期 iT: 、Ts 分 别 为 100ms、150ms、 

350ms, 每 个 周期 任务 的 处 理 时 间 Ci 、C;、Cs 分 别 为 20ms、40ms、100ms, 可 否 采 用 频率 单调 
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调度 算法 进行 调度 ? 如 果 可 以 , 则 画 出 它们 的 进程 调度 顺序 。 
解 : 由 于 





GG 1) 和 
头 十 采 二 新 一 0.753 < 3(21 一 1D) 0.780 


因此 ,RMS 算法 可 以 满足 所 有 任务 的 调度 要 求 。 

采用 RMS 算法 时 与 任务 A、B、C 相关 的 进程 调度 顺序 如 图 4-5 所 示 。 在 开始 时 ,进程 
Al 的 发 生 周期 比 进程 Bl 和 C1 都 短 , 因 此 其 优先 级 最 高 ,首先 调度 进程 A1。 在 100ms 时 ， 
虽然 进程 A2 到 达 , 它 的 优先 级 较 进程 Cl 高 ,但 RMS 算法 是 非 抢占 式 的 ,因此 ,进程 C1 接 
着 执行 。 当 进程 C1 执行 完 后 ,接着 执行 A2。 在 240 一 300ms 没有 进程 就 绪 , 因 此 CPU 空 
闲 , 直 到 300ms ,进程 A4 和 进程 B3 同时 就 绪 ,但 A4 优先 级 高 , 先 执行 A4, 后 执行 BB。 以 
此 类 推 , 直 到 任务 完成 。 





调度 顺序 | AL| B1 | Cl A2 B2 | A3 A4 B3 | c2 
时 间 /ms 0 20 60100150160 180 200 220 240 300 320 350 360 460 
任务 到 达 时 间 
A2 B2 A3 A4.B3 C2 


图 4-5 RMS 算法 的 调度 情况 


2. 最 早 截止 优先 算法 


最 早 截止 优先 (Earliest-Deadline-First,EDF) 算 法 采用 抢占 式 调度 , 既 可 用 于 周期 性 任 
务 ,也 可 用 于 非 周期 性 任务 。 当 一 个 事件 发 生 时 ,对 应 的 进程 被 加 到 就 绪 队 列 中 。 该 队列 按 
照 进程 要 求 的 截止 时 间 由 近 到 远 排 序 。 对 于 一 个 周期 性 事件 ,其 截止 时 间 即 为 事件 下 次 发 
生 的 时 间 。 该 算法 首先 运行 队 首 进 程 , 即 截 止 时 间 最 近 的 那个 。 

例 4-6 有 A.B 两 个 周期 性 任务 ,它们 的 发 生 周 期 分 别 为 29ms、50ms、 它 们 对 应 的 任务 
到 达 时 间 (就绪 时 间 )、 执 行 时 间 和 截止 时 间 如 表 4-5 所 示 。 画 出 采用 最 早 截止 优先 算法 时 
它们 的 调度 顺序 。 








表 4-5 实时 任务 
进程 任务 到 达 时 间 /ms 执行 时 间 /ms 截止 时 间 /ms 
Al 0 10 20 
A2 20 10 40 
A3 40 10 60 
A4 60 10 80 
Bl 0 25 50 
B2 50 25 100 


B3 100 25 150 





解 : 采用 EDF 算法 时 与 任务 A、B 相关 的 进程 调度 顺序 如 图 4-6 所 示 。 在 开始 时 ,进程 
Al 的 截止 时 间 比 进程 Bl 近 , 首 先 调度 进程 Al。 在 20ms 时 ,进程 A2 到 达 , 它 的 截止 时 间 
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比 进程 Bl 近 , 进 程 A2 抢占 进程 Bl 执行 。 在 30ms 时 ,进程 A2 执行 完毕 ,进程 A3 还 没有 
到 达 , 则 调度 进程 Bl 执行 。 以 此 类 推 ,直到 任务 完成 。 从 图 4-6 中 可 以 看 出 ,采用 EDF 算 
法 时 可 以 满足 任务 A、B 的 调度 要 求 。 


调度 顺序 ，AL | BI | A2 | BI JB1A3A3B2 A4 | B2 | B2 ，A5 ，.… |) 


时 间 /ms 0 10 20 30 40 45 50 55 60 70 80 90 100 
任务 到 达 时 间 4 





A2 A3 B2 A4 A5 
图 4-6 EDF 算法 的 调度 情况 


3. 最 低 松 弛 度 优先 算法 


最 低 松 弛 度 优先 (Least-laxity-First,LLF) 算 法 是 根据 任务 的 松弛 度 来 确定 任务 的 优先 
级 。 任 务 的 松弛 度 越 高 ,为 该 任务 所 赋予 的 优先 级 就 越 高 ,以 使 之 优先 执行 。 例 如 ,一 个 任 
务 在 200ms 时 必须 完成 ,而 它 本 身 所 需 的 运行 时 间 就 有 100ms, 因 此 ,调度 程序 必须 在 
100ms 之 前 调度 执行 ,该 任务 的 松弛 度 为 100ms。 又 如 , 另 一 任务 在 400ms 时 必须 完成 , 它 
本 身 需 要 运行 150ms, 则 其 松弛 度 为 250ms。 在 实现 LLF 算法 时 要 求 系统 中 有 一 个 按 松 弛 
度 排 序 的 实时 任务 就 绪 队 列 ,松弛 度 最 低 的 任务 排 在 队列 最 前 面 , 调 度 程序 总 是 选择 就 绪 队 
列 中 的 队 首 任务 执行 。LLF 算法 主要 用 于 可 抢占 调度 方式 中 。 

例 4-7 对 于 例 4-6 的 两 个 周期 性 任务 , 画 出 采用 LLF 算法 时 它们 的 调度 顺序 。 

解 : 采用 LLF 算法 时 与 EDF 算法 时 的 进程 调度 顺序 相同 ,如 图 4-6 所 示 。 在 开始 时 ， 
进程 Al 必须 在 20ms 时 完成 ,而 它 本 身 运 行 又 需 10ms, 可 算出 进程 Al 的 松弛 度 为 10ms; 
进程 Bl 必须 在 50ms 时 完成 ,而 它 本 身 运行 又 需 25ms, 可 算出 进程 Bl 的 松弛 度 为 25ms， 
故 调度 程序 应 先 调度 进程 Al 执行 。 在 20ms 时 ,进程 A2 的 松弛 度 可 按 下 式 算 出 : 

A2 的 松弛 度 = 截止 时 间 一 其 本 身 的 运行 时 间 一 当前 时 间 
40ms 一 10ms 一 20ms 一 10ms 

类 似 地 ,可 算出 Bl 的 松弛 度 =50ms 一 15ms 一 20ms 王 15ms, 故 进程 A2 先 运行 。 在 
30ms 时 ,进程 A2 运行 完成 ,A3 未 到 ,运行 Bl1, 直 到 40ms 时 , A3 到 达 , Al 的 松弛 度 为 
10ms,Bl 松弛 度 已 减 为 5ms, 直 到 45ms 时 ,Bl 完成 。 以 此 类 推 ,直到 任务 完成 。 从 图 4-6 
中 可 以 看 出 ,采用 LLF 算法 时 可 以 满足 任务 A、B 的 调度 要 求 。 

尽管 在 理论 上 通过 使 用 这 3 种 调度 算法 中 的 一 种 可 以 将 一 个 通用 操作 系统 转变 为 一 个 
实时 系统 ,但 实际 上 ,通用 操作 系统 的 上 下 文 切换 开销 太 大 ,以 至 于 只 对 那些 时 间 限 制 较 松 
的 应 用 才能 达到 其 实时 性 能 要 求 。 这 就 导致 多 数 实 时 系统 使 用 专用 的 实时 操作 系统 。 这 些 
系统 具有 一 些 很 重要 的 特征 ,典型 的 特征 包括 : 规模 小 ,中 断 时 间 很 短 , 进 程 切换 很 快 , 中 断 
被 屏蔽 的 时 间 很 短 ,以 及 能 够 管理 毫秒 或 微 秒 级 的 多 个 定时 器 等 。 


人 14 多 处 理 机 调度 


为 了 实现 对 信息 的 高 度 并 行 处 理 ,提高 系统 的 吞吐 量 和 高 的 可 靠 性 。20 世纪 90 年 代 
中 后 期 ,计算 机 系统 中 出 现 了 多 处 理 机 系统 (MultiProcessor System,MPS) 。 目 前 随 着 处 理 











110 


SA 


操作 系统 原理 及 Linux 内 核 分 析 (第 2 版 ) 


机 价格 的 下 降 , 多 处 理 机 已 经 成 为 服务 器 的 普遍 配置 ,一 些 个 人 计算 机 主板 也 增加 了 CPU 
插 槽 ,许多 商业 操作 系统 如 Linux、Windows 等 都 提供 了 对 多 处 理 机 的 支持 。 

多 处 理 机 操作 系统 要 比 单 处 理 机 操作 系统 复杂 得 多 , 除 调度 之 外 ,还 有 并 发 控制 问题 。 
例如 ,不 能 使 两 个 处 理 机 选择 相同 的 进程 ,也 不 能 在 并 发 访问 调度 队列 时 丢失 进程 。 多 处 理 
机 调度 应 在 保证 正确 性 的 前 提 下 ,充分 利用 处 理 机 资源 ,提高 系统 效率 。 


4.4.1 多 处 理 机 系统 的 类 型 
1. 紧密 耦合 MPS 和 松弛 耦合 MPS 


从 多 处 理 器 之 间 耦 合 的 紧密 程度 上 ,可 把 MPS 分 为 两 类 : 紧密 耦合 MPS 和 松弛 耦 
合 MPS。 

(1) 紧密 耦合 (Tightly Coupled)MPS。 通 常 通过 高 速 总 线 或 高 速 交 叉 开 关 来 实现 多 个 
处 理 器 之 间 的 互 连 。 它 们 共享 主 存储 器 系统 和 I/O 设备 ,并 要 求 将 主 存储 器 划分 为 若干 个 
能 独立 访问 的 存储 器 模块 ,以 便 多 个 处 理 机 能 同时 对 主 存 进 行 访问 。 系 统 中 的 所 有 资源 和 
进程 都 由 操作 系统 实施 统一 的 控制 和 管理 。 

(2) 松散 耦合 (Loosely Coupled)MPS。 在 松散 耦合 MPS 中 ,通常 是 通过 通道 或 通信 线 
路 来 实现 多 台 计 算 机 之 间 的 互 连 。 每 台 计算 机 都 有 自己 的 存储 器 和 IO 设备 ,并 配置 了 操 
作 系 统 来 管理 本 地 资源 和 在 本 地 运行 的 进程 。 因 此 ,每 一 台 计算 机 都 能 独立 地 工作 ,必要 时 
可 通过 通信 线路 与 其 他 计算 机 交换 信息 ,以 及 协调 它们 之 间 的 工作 。 


2. 对 称 多 处 理 器 系统 和 非 对 称 多 处 理 器 系统 


根据 系统 中 所 用 处 理 器 相同 与 否 , 可 将 MPS 分 为 如 下 两 类 : 对 称 多 处 理 器 系统 和 非 对 
称 多 处理 器 系统 。 

(1) 对 称 多 处 理 器 系统 (Symmetric MultiProcessor System,SMPS) 。 系 统 中 所 包含 的 
各 处 理 器 单元 在 功能 和 结构 上 都 是 相同 的 ,当前 的 绝 大 多 数 MPS 都 属于 SMPS。 

(2) 非 对 称 多 处 理 器 系统 (Asymmetric MultiProcessing System, AMPS)。 在 系统 中 有 
多 种 类 型 的 处 理 单元 ,它们 的 功能 和 结构 各 不 相同 ,其 中 只 有 一 个 主 处 理 器 ,有 多 个 从 处 
理 咒 。 


4.4.2 多 处 理 机 系统 调度 方式 
1. 非 对 称 多 处 理 机 系统 调度 方式 


非 对 称 多 处 理 机 系统 大 多 采用 主 / 从 式 进程 (线程 ) 分 配 的 方式 。 即 操作 系统 的 核心 部 
分 驻 留 在 一 台 主 机 上 ,而 从 机 上 只 有 用 户 程序 。 进 程 调度 由 主机 执行 ,每 当 从 机 空闲 时 , 便 
向 主机 发 送 一 条 请 求 进程 (线程 ) 的 信号 ,由 主机 为 它 分 配 进 程 (线程 ) 。 分 配 算法 可 采用 单 
处 理 机 系统 的 所 有 算法 ,如 FCFS、HPF 等 。 在 主机 中 保持 一 个 就 绪 队 列 , 只 要 就 绪 队 列 不 
空 ,主机 便 从 其 队 首 摘 取 一 个 进程 (线程 ) 分 配给 请 求 的 从 机 。 当 有 多 个 从 机 同时 发 出 请 求 
时 ,还 需 考 虑 处 理 机 类 型 与 计算 任务 类 型 ,例如 科学 计算 最 好 在 浮 点 处 理 器 上 运行 。 

在 非 对 称 的 MPS 中 , 主 /从 式 进程 (线程 ) 分 配方 式 的 主要 优点 是 ,因为 所 有 进程 的 分 
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配 由 一 台 主 机 处 理 , 使 进程 间 的 同步 问题 得 以 简化 ,因此 ,系统 处 理 较 简单 。 但 由 一 台 主 机 
控制 一 切 , 有 潜在 的 不 可 靠 性 , 即 主 机 一 旦 出 现 故 障 ,将 导致 整个 系统 瘫痪 ,而 且 也 会 因为 主 
机 太 忙 ,来 不 及 处 理 而 形成 系统 瓶颈 。 


2. 对 称 多 处 理 机 系统 调度 方式 


对 称 多 处 理 机 系统 是 目前 较为 常见 的 配置 ,也 是 目前 商业 操作 系统 普遍 支持 的 类 型 。 
因此 ,存在 许多 的 调度 方式 ,其 中 多 是 以 线程 作为 基本 调度 单位 。 比 较 有 代表 性 的 调度 方式 
有 自 调度 方式 .组 调度 方式 。 

1) 自 调度 

自 调度 (self-scheduling) 也 称 均衡 调度 。 系 统 中 保持 唯一 的 一 个 就 绪 队 列 ,新 创建 的 线 
程 或 被 唤醒 的 线程 都 进入 这 个 唯一 的 就 绪 队 列 。 系 统 中 某 个 处 理 机 空闲 下 来 时 , 便 到 该 就 
绪 队 列 中 按 调度 算法 选取 下 一 个 运行 的 线程 。 其 调度 算法 可 采用 单 处 理 机 系统 的 所 有 
算法 。 

这 种 算法 的 主要 优点 是 : 不 需要 专门 的 处 理 机 从 事 任 务 分 派 工作 ; 只 要 系统 中 有 任 
务 ,或 者 说 只 要 公共 就 绪 队 列 不 空 ,就 不 会 出 现 处 理 机 空闲 的 情况 ; 任务 分 配 均衡 ,不 会 发 
生 处 理 机 忙 闲 不 均 的 现象 ,因而 有 利于 提高 处 理 机 的 利用 率 。 其 主要 缺点 是 : 这 种 调度 必 
须 基 于 专门 的 互 斥 机 制 , 保 证 多 处 理 机 不 会 同时 访问 系统 中 唯一 的 就 绪 队 列 ; 当 处 理 机 个 
数 较 多 (如 十 几 个 或 上 百 个 ) 时 ,对 就 绪 队 列 的 访问 可 能 成 为 系统 的 瓶颈 ; 线程 的 两 次 相继 
调度 可 能 被 不 同 处 理 机 选择 ,使 得 局 部 缓冲 信息 失效 ; 不 能 保证 同一 进程 中 的 多 个 线程 被 
同时 调度 ,而 对 于 同一 个 应 用 程序 中 的 多 个 相互 合作 的 线程 来 说 ,不 能 同时 调度 ,就 可 能 加 
长 相互 等 待 的 时 间 。 

2) 组 调度 

组 调度 (gang-seheduling) 的 思想 实际 上 早 于 线程 。 基 于 进程 的 组 调度 是 将 一 组 相关 的 
进程 同时 分 派 到 多 台 处 理 机 上 运行 ,以 减少 进程 之 间 相 互 等 待 而 引起 的 进程 切换 ,从 而 降低 
系统 开销 。 线 程 级 别 的 组 调度 是 将 同一 进程 中 的 多 个 线程 同时 分 派 到 多 个 处 理 机 上 运行 ， 
以 减少 因 相关 线程 之 间 的 相互 等 待 而 引起 的 切换 ,提高 线程 推进 速度 ,从 而 提高 系统 处 理 
效率 。 

组 调度 的 每 次 调度 都 可 以 解决 一 组 线程 的 处 理 器 分 配 问题 ,因而 可 以 显著 地 减少 调度 
频率 ,从 而 也 减少 了 调度 开销 ,可 见 组 调度 的 性 能 优 于 自 调度 。 目 前 组 调度 已 获得 广泛 的 认 
可 ,并 被 应 用 到 许多 种 多 处 理 机 操作 系统 中 。 


人 5 死 锁 


在 多 道 程序 系统 中 ,使 多 个 进程 并 发 运行 共享 系统 资源 ,从 而 提高 了 资源 的 利用 率 ,也 
提高 了 系统 的 处 理 能 力 。 但 是 ,如 果 资 源 使 用 不 当 , 会 导致 一 组 进程 进入 死 锁 状态 。 在 一 些 
系统 中 ,一 旦 发 生死 锁 , 最 终 会 导致 整个 系统 的 瘫痪 。 因 此 ,对 于 死 锁 问 题 的 解决 是 操作 系 
统 中 的 一 个 重要 问题 。 死 锁 的 解决 主要 包括 死 锁 的 预防 、 避 免检 测 和 解除 等 技术 。 
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4.5.1 死 锁 的 产生 
1. 什么 是 死 锁 


死 锁 是 因 竞 争 资源 而 引起 的 一 种 普遍 现象 。 不 仅 在 计算 机 系统 中 ,而 且 在 日 常生 活 
中 也 是 屡见不鲜 。 例 如 十 字 路 口 的 交通 阻塞 ,每 个 方向 行驶 的 车 流 均 被 男 一 个 方向 的 车 
流 所 阻塞 ,致使 谁 也 无 法 前 进 。 可 以 把 十 字 路 口 看 作 是 车 流 互相 竞争 的 共享 资源 。 现 在 
每 个 方向 的 车 流 都 占用 一 部 分 资源 ,而 要 求 其 他 方向 的 车 流 释放 资源 ,结果 使 得 谁 也 不 
能 释放 所 占用 的 资源 ,也 不 能 满足 所 要 求 的 资源 ,而 使 各 个 方向 的 车 流 处 于 无 休止 的 相 
互 等 待 中 。 

死 锁 是 指 一 组 并 发 进程 互相 等 待 对 方 所 拥有 的 资源 , 且 这 些 并 发 进程 在 得 到 对 方 的 资 
源 之 前 不 会 释放 自己 所 拥有 的 资源 ,从 而 使 并 发 进程 不 能 继续 向 前 推进 的 状态 。 陷 入 死 锁 
状态 的 进程 称 为 死 锁 进程 。 

在 多 道 系统 中 ,实现 资源 共享 是 操作 系统 的 基本 目标 。 但 不 少 资源 必须 互 斥 地 使 用 ,在 
这 种 情况 下 ,比较 容易 发 生死 锁 。 

例 4-8 假设 系统 中 有 一 台 打印 机 (R,) 和 一 台 输入 机 (Rs: ) ,由 两 个 进程 P 和 P。 共享 。 
且 每 个 进程 以 下 列 的 使 用 顺序 请 求 这 两 个 资源 。 

P1: 请 求 Ri 一 请 求 R, 一 释放 Ri 一 释放 R， 。 

P2: 请 求 R, 一 请 求 Ri 一 释放 Ri 一 释放 R。 。 

当 这 两 个 进程 并 发 运行 时 ,是 否 会 发 生死 锁 ? 

解 : 由 于 进程 执行 时 的 异步 特性 ,有 可 能 出 现下 列 这 种 进程 的 推进 顺序 : P, 请 求 R; 
P， 请 求 Rs ; Pi 请 求 Rs (阻塞 ); P; 请 求 Ri (阻塞 ) 。 

当 进 程 Pi 执行 到 请 求 Ri 时 ,因为 此 时 资源 Ri 空闲 ,因此 将 Ri 分 配给 进程 Pl 。 此 后 ， 
进程 P, 得 到 处 理 机 (如 进程 P 的 时 间 片 到 ) ,在 进程 P, 执行 完 请 求 R, 后 ,得 到 资源 R,。 
再 把 处 理 机 给 进程 Pi ,请 求 Rs ,但 此 时 ,Rs 已 分 配给 进程 P ,因此 ,进程 P, 进入 阻塞 状态 。 
在 进程 P, 执行 到 请 求 Ri 时 ,Ri 被 进程 P, 占用 ,因此 ,进程 P。 进入 阻塞 状态 。 此 时 ,进程 
Pi 和 Ps 各自 占 用 了 对 方 所 需 的 资源 ,而 又 申请 新 的 资源 ,在 没有 得 到 所 需 的 资源 之 前 ,都 
不 会 将 自己 占用 的 资源 释放 ,致使 它们 互相 等 待 ,在 无 外 力 的 情况 下 ,将 会 无 休止 地 等 待 下 
去 ,这 时 就 说 进程 P 和 P, 进程 进入 了 死 锁 状态 。 


2. 产生 死 锁 的 原因 


竞争 有 可 能 产生 死 锁 ,但 并 不 是 一 定 会 产生 死 锁 。 死 锁 产 生 的 原因 主要 有 两 点 : 

(1) 系统 资源 不 足 ( 根 本 原因 )。 系 统 中 配置 的 许多 资源 是 互 斥 资源 ,因为 互 斥 资源 一 
旦 分 配给 某 一 进程 后 , 便 不 能 强行 收回 ,一 直到 进程 使 用 完 后 , 才 可 分 配给 别 的 进程 。 系 统 
中 供 多 个 进程 共享 的 资源 其 数量 不 能 满足 各 个 进程 的 需要 时 ,会 引起 进程 对 资源 的 竞争 而 
产生 死 锁 。 例 如 ,在 例 4-8 中 ,如 果 有 两 台 打印 机 或 两 台 输 入 机 就 不 会 产生 死 锁 。 

(2) 进程 推进 顺序 不 合适 。 由 于 进程 执行 时 的 异步 特性 ,如 果 让 例 4-8 中 的 进程 P 和 
进程 Ps 顺序 执行 , 则 不 会 发 生死 锁 。 例 如 按 如 下 顺序 推进 : P, 请 求 Ri 一 Pi 请 求 R, 一 P。 
请 求 R, (阻塞 ) 一 Pi 释放 Ri 一 Pi 释放 Rs (唤醒 P: )-~P。 请 求 Ri-~P。 释放 Ri 一 Ps 释放 Rs。 
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虽然 在 执行 过 程 中 由 于 等 待 资源 出 现 了 阻塞 状态 ,但 不 会 发 生死 锁 。 我 们 说 上 述 两 种 进程 
的 推进 顺序 是 合法 的 ,而 引起 进程 发 生死 锁 的 推进 顺序 是 不 合法 的 ,如 例 4-8 中 所 述 的 资源 
请 求 顺序 。 


4.5.2 死 锁 的 必要 条 件 


综 上 所 述 ,由 于 系统 资源 的 不 足 、 进 程 争夺 的 是 互 斥资 源 、 进 程 的 异步 特性 等 原因 ,使 进 
程 在 执行 的 过 程 有 可 能 发 生死 锁 ,但 并 非 一 定 发 生死 锁 。 发 生死 锁具 有 如 下 的 4 个 必要 条 
件 。 即 如 果 一 组 进程 之 间 发 生死 锁 , 则 4 个 条 件 必然 都 存在 ; 而 如 果 4 个 条 件 之 一 不 存在 ， 
则 一 定 不 会 发 生死 锁 。 

(1) 互 斥 条 件 。 指 进程 竞争 的 资源 具有 互 斥 性 , 即 在 一 段 时 间 内 某 资源 被 一 个 进程 占 
用 ,如 果 此 时 还 有 其 他 进程 请 求 使 用 该 资源 , 则 只 能 等 待 ,直到 占用 该 资源 的 进程 用 完 后 主 
动 释放 。 

(2) 不 可 剥夺 条 件 ( 不 可 抢占 条 件 )。 指 已 分 配给 某 一 进程 的 资源 ,在 它 未 使 用 完 之 前 ， 
不 能 强行 剥夺 ,只 能 在 使 用 完 后 ,由 进程 自己 释放 。 

(3) 部 分 分 配 条 件 (请求 与 保持 条 件 )。 指 进程 已 经 占用 


























了 一 部 分 资源 ,但 又 提出 新 的 资源 请 求 , 而 该 资源 又 被 其 他 的 2 

进程 所 占用 ,此 时 请 求 进程 只 能 阻塞 ,但 又 对 自己 占用 的 资源 

保持 不 放 。 ® 
(4) 环 路 条 件 ( 循 环 等 待 条 件 )。 指 进程 发 生死 锁 时 ,必然 

存在 一 个 进程 -资源 的 环形 链 。 即 有 一 组 进程 P,P ,…,P,, 其 Re 

中 ,Pi 正在 等 待 P, 占用 的 资源 ,P, 正在 等 待 P; 占用 的 资 ”图 4-7 两 个 进程 发 生死 锁 

源 ……P, 正 在 等 待 P, 占用 的 资源 。 图 4-7 所 示 为 两 个 进程 竞 时 的 环形 图 

争 两 个 资源 的 环形 图 。 


@.6 解决 死 锁 问题 的 方法 


在 讨论 了 死 锁 的 产生 原因 和 死 锁 的 必要 条 件 后 ,就 可 以 根据 死 锁 产 生 的 原因 和 条 件 寻 
求 一 些 解决 死 锁 的 办 法 ,以 及 当 死 锁 发 生 以 后 应 采取 的 措施 。 常 用 的 方法 有 死 锁 的 预防 、 避 
免 .检测 和 解除 。 


4.6.1 死 锁 的 预防 


死 锁 的 预防 主要 研究 的 问题 是 如 何 破坏 死 锁 产生 的 必要 条 件 ,从 而 达到 不 使 死 锁 发 生 
的 目的 。 

在 死 锁 的 4 个 必要 条 件 中 ,“ 互 斥 ” 条 件 是 设备 固有 的 属性 ,很 难 改 变 ; 如 果 人 允许 破坏 
“不 可 剥夺 "条件, 系统 为 了 保护 在 自动 放弃 资源 时 的 现场 以 及 以 后 恢复 现场 ,需要 付出 很 高 
的 代价 。 由 此 还 可 能 出 现 进 程 反复 地 申请 和 释放 某 些 资源 而 被 无 限 延迟 执行 的 现象 。 
此 , 死 锁 的 预防 措施 主要 是 破坏 “部 分 分 配 ” 条 件 和 “ 环 路 等 待 " 条 件 。 
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1. 防止 “部 分 分 配 ” 条 件 的 出 现 


要 打破 部 分 分 配 条 件 , 可 以 采用 一 次 性 分 配 策略 (也 称 为 资源 的 静态 预 分 配 策略 )。 系 
统 要 求 任 一 进程 必须 预先 申请 它 所 需要 的 全 部 资源 ,而 且 仅 当 该 进程 的 全 部 资源 要 求 都 能 
得 到 满足 时 ,系统 才 给 予 一 次 性 分 配 , 然 后 启动 该 进程 运行 。 进 程 在 整个 生存 期 间 不 再 请 求 
新 的 资源 。 如 果 进 程 所 要 求 的 某 一 资源 不 能 满足 , 则 其 他 资源 也 不 分 配给 它 ,进程 转 人 等 待 
状态 ,这 样 ,进程 在 等 待 期 间 不 会 占用 任何 资源 。 因 此 ,部 分 分 配 ? 条 件 不 会 出 现 , 死 锁 也 就 
不 可 能 发 生 。 

该 方法 简单 安全 ,易于 实施 。 但 是 它 会 产生 资源 浪费 ,资源 利用 率 很 低 。 因 为 进程 所 申 
请 的 全 部 资源 中 有 一 些 很 少 被 使 用 或 者 在 进程 运行 后 期 才 使 用 ,甚至 有 的 资源 在 进程 正常 
运行 情况 下 完全 不 被 利用 。 例 如 ,进程 申请 一 台 打 印 机 ,以 在 处 理 出 错时 将 有 关 现 场 信 息 打 
印 输出 ,但 是 ,如 果 进 程 运 行 中 不 发 生 错误 ,这 人 台 打 印 机 就 一 直 闲 着 。 采 用 一 次 性 分 配 策略 
将 使 进程 因 得 不 到 所 需 的 全 部 资源 而 长 期 等 待 ,这 样 将 延长 进程 的 周转 时 间 。 


2. 防止 “ 环 路 等 待 " 条 件 的 出 现 


合理 规划 进程 的 执行 顺序 或 者 资源 的 申请 顺序 ,可 以 破坏 环 路 等 待 条 件 。 可 采用 资源 
顺序 使 用 法 ,把 系统 中 所 有 资源 按 类 型 分 类 ,并 赋予 每 类 资源 以 唯一 的 编号 ,例如 输入 机 为 
1 号 ,打印 机 为 2 号 ,磁带 机 为 3 号 ,磁盘 机 为 4 号 ,等 等 。 进 程 申请 资源 时 ,必须 严格 按照 
资源 编号 的 递增 顺序 进行 ,否则 系统 不 予 分 配 。 由 于 在 任何 时 刻 总 有 一 个 进程 占有 较 高 纺 
号 的 资源 , 它 继续 请 求 资源 的 要 求 必然 可 获 满 足 , 因 此 ,一 定 不 会 出 现 “ 环 路 等 待 " 条 件 。 

与 预 分 配 策略 比较 ,资源 顺序 使 用 法 显著 提高 了 资源 利用 率 。 但 是 ,实际 上 有 些 进程 使 
用 资源 的 顺序 往往 与 系统 规定 的 不 一 致 ,于 是 某 些 暂 时 不 用 的 资源 要 先 申 请 , 先 占 住 又 暂 不 
使 用 ,降低 了 资源 利用 率 。 另 外 ,严格 地 限制 使 用 资源 的 顺序 ,也 给 程序 设计 带 来 了 不 便 。 


4.6.2 死 锁 的 避免 


死 锁 的 避免 与 预防 的 区 别 在 于 : 预防 是 严格 地 破坏 死 锁 的 必要 条 件 之 一 ,使 之 不 在 系 
统 中 出 现 。 避 免 是 不 那么 严格 地 限制 必要 条 件 的 存在 (必要 条 件 存 在 ,系统 未 必 发 生死 锁 )。 
而 是 在 系统 运行 过 程 中 关注 那些 产生 死 锁 的 情况 ,避免 死 锁 的 产生 ,目的 是 提高 系统 的 资源 
利用 率 。 其 基本 思想 是 : 找 出 一 个 合适 的 算法 , 当 进 程 请 求 资源 时 ,判断 分 配 资源 后 系统 是 
和 否 处 于 安全 状态 。 如 果 系统 处 于 安全 状态 , 则 分 配 资源 ; 如 果 不 安全 ,系统 让 提出 资源 分 配 
的 进程 等 待 ,直到 别 的 进程 释放 资源 。 


1. 安全 状态 


在 某 个 时 刻 上 ,系统 的 资源 分 配 状 态 s(7) 定 义 为 系统 中 的 可 用 资源 数 、 已 分 配 资源 数 以 
及 各 进程 对 资源 的 最 大 需求 量 的 当前 情况 。 此 后 ,如 果 系 统 能 够 按 某 种 次 序 为 每 个 进程 分 
配 它们 所 需 的 资源 ,使 各 个 进程 都 可 顺利 完成 ,那么 称 状态 s(7) 是 安全 的 。 即 ,对 于 系统 中 
的 各 进程 p;(i 二 1,2,…,n), 存 在 一 个 安全 的 进程 执行 序列 (pi ,ps，… ,pi，…,p,)。 序 列 
(pi1,p:，… ,pi，…,p,) 是 安全 的 是 指 ,对 于 每 个 进程 p; 的 资源 剩余 需求 数 ( 即 p; 的 最 大 资 
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源 需 求 数 减 去 它 的 已 占用 数 ) 均 可 得 到 满足 ,使 其 顺利 完成 。 即 便 进 程 p; 所 需 的 资源 不 能 
立即 被 满足 ,但 在 其 他 进程 运行 完毕 后 一 定 可 满足 。 如 果 不 存在 这 样 的 进程 序列 , 则 称 系统 
状态 *(2) 是 不 安全 的 。 

下 面 通过 一 个 例子 来 说 明 安 全 状态 。 

例 4-9 假定 系统 中 有 总 数 为 12 的 某 类 资源 ,3 个 进程 p1 、p: 和 ps, 且 它 们 对 该 类 资源 
的 最 大 需求 数 分 别 为 9.4、12。 假 设 在 时 刻 ,系统 的 分 配 状态 S(1) 如 表 4-6 所 示 。 找 一 个 
在 时 刻 工 存在 的 安全 序列 。 


表 4-6 系统 分 配 状态 








进程 最 大 需求 已 分 配 可 用 资源 
加 9 4 3 

p: 4 2 

ps 12 3 


解 : 此 时 ,资源 的 当前 可 用 数 为 3, 它 可 满足 进程 p; 的 剩余 需求 ,将 剩余 的 资源 分 配 2 
个 给 进程 p, ,ps 可 继续 运行 ,在 ps 运行 完成 后 ,系统 可 回收 ps 所 占用 的 4 个 资源 ,此 时 , 系 
统 资源 的 可 用 数 为 5, 可 满足 进程 p, 的 资源 剩余 需求 数 ,以 后 将 这 些 资 源 全 部 分 配给 进程 
轧 , 进 程 pi 完成 后 ,可 释放 它 所 占用 的 全 部 资源 ,系统 资源 的 可 用 数 为 9, 从 而 ps 可 获得 足 
够 的 资源 顺利 运行 完成 。 因 此 ,在 时 刻 存在 安全 序列 (p, ,pi , 思 ) ,系统 处 于 安全 状态 。 

如 果 不 按照 安全 序列 分 配 资源 , 则 系统 可 能 由 安全 状态 进入 不 安全 状态 。 例 如 ,在 时 刻 
工 以 后 ,在 时 刻 To ,进程 ps 又 请 求 1 个 该 类 资源 , 则 将 剩余 的 3 个 资源 分 配 1 个 给 进程 ps， 
分 配 后 的 状态 见 表 4-7。 

表 4-7 分 配 后 的 状态 





进程 最 大 需求 已 分 配 可 用 资源 
办 9 4 2 

p: 4 2 

ps 12 4 


此 时 ,系统 进入 不 安全 状态 。 因 为 此 时 系统 的 可 用 资源 数 为 2, 将 剩余 的 资源 全 部 分 配 
给 进程 p; ,在 ps 运行 完成 后 ,系统 可 回收 ps 所 占用 的 4 个 资源 ,此 时 ,系统 资源 的 可 用 数 
为 4, 均 不 满足 进程 p, 和 ps 的 资源 剩余 需求 数 。 因 此 找 不 到 一 个 安全 的 进程 序列 , 故 状态 
S(T,) 是 不 安全 的 。 

需要 说 明 的 是 ,系统 进入 不 安全 状态 并 不 就 是 说 系统 处 于 死 锁 状态 , 它 只 是 意味 着 可 能 
导致 死 锁 的 产生 。 

2. 银行 家 算法 

最 有 代表 性 的 避免 死 锁 的 算法 是 Dijkstra 提出 的 银行 家 算法 。 这 一 名 称 的 由 来 是 由 于 
该 算法 把 操作 系统 比 作 一 个 银行 家 ,把 操作 系统 管理 的 各 种 资源 比 作 银行 的 可 周转 的 借贷 
资金 ,而 把 申请 资源 的 进程 比 作 借贷 的 客户 。 如 果 每 个 客户 的 借贷 总 额 不 超过 银行 的 借贷 
资金 总 数 , 而 且 在 有 限 的 期 限 内 银行 可 收回 借 出 的 全 部 贷款 ,那么 银行 就 可 满足 客户 的 借贷 
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要 求 , 同 客户 进行 借贷 交易 ,否则 银行 将 拒绝 借贷 给 客户 。 

1) 数据 结构 

银行 家 算法 中 用 到 下 列 数据 结构 , 令 n 是 系统 中 的 进程 数 ,m 是 资源 类 数 。 

(1) 可 用 资源 向 量 A(CAvailable)。 向 量 4 的 长 度 为 m ,向量 元 素 A[j](j==1,2,*…,m) 
为 系统 中 资源 类 x; 的 当前 可 用 数 。 

(2) 最 大 需求 矩阵 M(Max) 。M 是 一 个 nXm 的 矩阵 ,矩阵 元 素 M[i,j 站 为 进程 p; 关于 
资源 类 x; 的 最 大 需求 数 ,每 个 进程 必须 预先 申报 。 

(3) 资源 占用 和 矩阵 U(CUse) 。U 是 一 个 nXm 的 矩阵 ,矩阵 元 素 U[i,j] 为 进程 p; 关于 
资源 类 7x; 的 当前 占用 数 。 

(4) 剩余 需求 矩阵 NINeed) 。N 是 一 个 nXm 的 矩阵 ,矩阵 元 素 N[i,j] 是 进程 p; 还 需 
要 的 资源 类 x; 的 数量 。 显 然 有 N[i,j] 二 M[i,j] 一 U[i,j]。 

2) 简 记 法 

为 了 简化 对 算法 的 描述 ,对 上 述 数 据 结构 采用 如 下 的 简 记 法 : 

(1) 令 XX 和 YY 为 长 度 是 mm 的 向 量 ,着 六 二 Y, 当 且 仅 当 对 任意 的 i(i 二 1,2,…,m) 有 
X[i<Y[i]。 

(2) 对 于 nXm 的 矩阵 Zw ,Zi 一 1,2,…,2) 表 示 和 矩阵 Z,x 的 第 i 个 行 向 量 。 

3) 算法 描述 

令 RR; 是 长 度 为 m 的 进程 p; 的 资源 请 求 向 量 , 元 素 RR[i, 站 是 进程 p; 请 求 分 配 的 资 
源 类 六 的 数量 。 当 进程 p; 向 系统 提交 一 个 资源 请 求 向 量 RR; 时 ,系统 调用 银行 家 算法 执 
行 下 述 工作 : 

(1) 若 RR 字 Ni , 则 有 (CRR, 十 Ui) 二 M;, 即 进程 p; 请 求 的 资源 数量 大 于 它 申 请 的 最 大 需 
求 数 , 故 请 求 无 效 , 作 出 错 处 理 ; 否则 进行 下 一 步 。 

(2) 若 RR;>4, 则 进程 p; 必须 等 待 , 即 系统 当前 没有 足够 的 资源 满足 进程 p; 当前 的 
请 求 ; 否则 进行 下 一 步 。 

(3) 系统 进行 假 分 配 , 即 假设 系统 给 进程 p; 分 配 所 请 求 的 资源 ,对 资源 分 配 状 态 作 如 
下 修改 : 





4 一 4 一 人 RR， 
U; = U; 十 RR， 
Ni = Ni — RR:; 











(4) 调用 安全 算法 检查 此 次 资源 分 配 后 的 现行 状态 是 否 为 安全 状态 。 若 安全 , 则 正式 
将 资源 分 配给 进程 p; ,完成 进程 p; 的 资源 请 求 分 配 工作 。 否 则 拒绝 分 配 ,让 进程 等 待 ,并 恢 
复 此 次 的 假设 分 配 , 即 撤销 步骤 (3) 对 分 配 状态 所 作 的 修改 。 

4) 安全 算法 描述 

(1) 设 向 量 W(CWork) ,向 量 元 素 W[j]G==1,2,…,m) 表 示 系 统 可 供给 各 个 进程 继续 运 
行 的 j 类 资源 数 ; 向 量 F(Finish) ,向 量 元 素 F[ 门 (i 二 1,2,…,n) 表 示 系 统 是 否 有 足够 的 资 
源 可 使 进程 p; 完成 。 初 始 化 W=A,F[i] 二 false。 

(2) 从 进程 集合 中 找到 一 个 进程 p;, 有 FF[ 疏 二 false 且 N; 夺 W, 则 执行 步 又 (3); 如 果 这 
样 的 进程 不 存在 , 则 转 去 执行 步骤 (4) 。 

(3) 进程 p; 可 得 到 所 需 的 全 部 资源 ,顺利 执行 完成 ,并 释放 它 所 占用 的 资源 ,所 以 执行 
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W=W 十 U; 及 下 [让 =true, 转 去 执行 (2) 。 
(4) 若 对 所 有 的 进程 ,都 有 F[ 门 二 true, 则 存在 一 个 安全 序列 ,现行 状态 是 安全 的 ,否则 


是 不 安全 的 。 


下 面 通过 一 个 例子 来 说 明 银 行家 算法 的 应 用 。 


例 4-10 


假定 系统 中 有 5 个 进程 {p1,ps ,ps ,ps,ps)} 和 4 类 资源 。 若 在 To 时刻 出 现 如 


图 4-8 所 示 的 资源 分 配 情况 ,试问 : 如 果 进 程 p, 提出 资源 请 求 RR, 二 (0,4,2,0) ,系统 能 否 
将 资源 分 配给 它 ? 为 什么 ? 


0012 0000 
1000 0750 
A=(1,5,2,0) Usa=|1 354 Ni4=|1002 
0 632 0020 
0014 1642 


图 4-8 资源 分 配 状态 


解 : 利用 银行 家 算法 进行 检查 。 


(1) RR: 生 Na: , 即 (0,4,2,0) 委 (0,7,5,0) ,继续 下 一 步 。 
(2) RR:<4, 即 (0,4,2,0) 委 (1,5,2,0) ,继续 下 一 步 。 
(3) 进行 假 分 配 : 
4 一 4 一 RR。 
U: = U: 十 RR。 
N, = N, — RR; 
分 配 后 的 状态 图 如 图 4-9 所 示 。 
0012 0000 
1420 从 人 0 
A=(1,1,0,0) Usa=|1 354 Ni4=|1002 
0632 0 人 2 
0014 1642 


图 4-9 假 分 配 后 的 资源 分 配 状态 


(4) 执行 安全 算法 : 

@ 设 向 量 W=A=(1,1,0,0),F[i]=false(i==1,2,3,4,5)。 

@ 有 F[1]=false 且 NW, 即 (0.0,0,0) 志 (1,1,0,0), 则 执行 W=W 十 0 二 (1,1,1， 
2) ,及 F[1]==true。 


有 F[3] 


一 false 且 Ns 二 W, 即 (1,0,0,2) 志 (1,1,1,2), 则 执行 W=W 十 Us 二 (2,4,6,6)， 


及 F[3]==true。 


有 下 [2] 


二 false 且 Ns; 寺 W, 即 (0,3,3,0) 达 (2,4.6,6), 则 执行 W=W 十 Us 二 (3,8,8,6)， 


及 FL[2]=true。 


有 FL4] 


二 false 且 NW, 即 (0,0,2,0) 志 (3,8,8,6), 则 执行 W=W 十 U4 二 (3,14,11， 


8) ,及 下 [4] 一 true。 





有 下 [5] 


二 false 且 Ns 声 W;, 即 (1,6,4,2) 三 (3,14,11,8), 则 执行 W==W 十 Us 二 (3,14， 
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12,12) ,及 下 [5] 一 true。 

@ 对 所 有 的 进程 ,都 有 F[ 门 二 true, 得 到 一 个 安全 序列 (pi ,ps,ps,ps，ps), 故 状态 是 安 
全 的 。 

注意 : 安全 序列 不 是 唯一 的 。 

因此 ,如 果 进 程 p, 提出 资源 请 求 RR 二 (0,4,2,0) ,系统 可 以 将 资源 分 配给 它 。 

但 是 ,对 于 图 4-9 的 新 状态 ,假定 进程 p; 提出 资源 请 求 RR; 二 (1,0,0,0) ,虽然 有 RR; 三 
Ni 及 RR;s 三 A, 但 是 进行 假 分 配 后 的 状态 如 图 4-10 所 示 。 


0012 0000 
1420 0330 
4=(010.0) Uau=|1354 Na=|1002 
0 0020 
1014 0642 


4-10 ”ps 请 求 分 配 后 的 资源 分 配 状 态 


此 时 ,有 FL1]=false 且 和 Ni 夺 W, 则 执行 W= 二 W 十 0 二 (0,1,1,2) 及 F[1] 二 true 后 ,再 
也 找 不 到 一 个 进程 的 N; (i 二 2,.3,4,5) ,满足 N; 三 (0,1,1,2)。 所 以 ,图 4-10 所 示 状 态 找 不 
到 一 个 安全 序列 ,是 不 安全 状态 ,系统 将 拒绝 分 配 资源 ,让 进程 ps 等 待 ,以 避免 发 生死 锁 。 

银行 家 算法 虽然 能 有 效 地 避免 死 锁 的 发 生 , 但 是 也 存在 一 些 缺 点 。 例 如 它 要 求 系统 中 
被 分 配 的 每 类 资源 固定 ; 用 户 进程 数目 保持 固定 不 变 ; 要 求 用 户 事先 说 明 他 们 的 最 大 资源 
需求 ; 同时 每 次 进行 资源 分 配 前 都 要 进行 安全 性 检查 ,花费 处 理 机 时 间 等 。 


4.6.3 死 锁 的 检测 与 解除 


死 锁 的 预防 与 避免 都 可 严格 地 不 让 系统 发 生死 锁 ,但 是 它们 都 对 资源 的 使 用 设置 了 一 
些 限 制 , 并 且 增 加 了 系统 额外 的 负担 。 在 实际 系统 运行 中 ,资源 不 足 会 导致 死 锁 发 生 , 但 不 
是 一 定 就 会 发 生 , 因 此 ,为 了 提高 资源 的 利用 率 ,对 于 资源 的 使 用 和 用 户 进程 不 加 任何 限制 ， 
而 是 利用 一 些 机 制 检 测 系统 中 是 否 发 生 了 死 锁 ,如 果 有 死 锁 发 生 , 则 采用 一 定 的 方法 解除 
死 锁 。 





1. 资源 分 配 图 


图 论 是 一 种 能 够 用 于 许多 领域 中 解决 实际 问题 的 强 有 力 的 数学 工具 。 在 操作 系统 中 同 
样 能 够 利用 图 论 的 方法 来 研究 死 锁 问题 。 

系统 中 一 组 进程 使 用 一 组 资源 的 状态 S 可 用 资源 分 配 图 (Resoureces Allocation 
Graph,RAG) 来 表示 。 一 个 RAG 可 定义 为 一 个 有 向 图 S=(CN,E) ,其 中 N 是 节点 集合 ,E 
是 有 向 边 集 合 。N 又 包含 两 个 子 集 P 和 R, 子 集 P 二 {pi,ps，…,p,) ,pi 表示 进程 i ,在 图 中 
用 矩形 表示 ; 子 集 R= {ni ,ro，… ,7,) ,7; 表示 一 类 资源 j ,在 图 中 用 圆圈 表示 , 某 类 资源 可 能 
有 多 个 分 配 单位 ,在 图 形 中 用 圆圈 中 的 小 圆圈 表示 ; E 二 {rj 一 pi 或 p; 一 rj;), 其 中 ER， 
pi:EP,rj 王 pi 表示 已 分 配 一 个 单位 的 资源 x; 给 进程 p;. 在 图 中 有 一 条 从 节点 x; 指向 节点 
pp; 的 有 向 边 , 称 作 分 配 边 ; p; 一 ri 表示 进程 p; 申请 一 个 单位 的 资源 xj ,在 图 中 有 一 条 从 节 
点 p; 指向 节点 六 的 有 向 边 , 称 作 申 请 边 。 








第 4 章 ”处 理 机 调度 与 死 锁 


例 4-11 在 某 一 时 刻 系统 中 有 3 个 进程 和 4 类 资源 : 
P= {pp2sps}, R= {rvrsors re) 
它们 申请 资源 和 占用 资源 的 情况 为 
E= {p> rp > rn par > piore > porrs > parr > pasps >r} 
其 中 ,各 个 资源 的 单位 数 为 : In | 二 1,1rs1==2,1rs | 二 1,|ns| 二 3, 画 出 在 这 一 时 刻 它们 
对 应 的 RAG。 
解 : 在 这 一 时 刻 它们 的 RAG 如 图 4-11(a) 所 示 。 
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CA (b) 使 p; 成 为 孤立 节点 
© "© "© 
pi Pp 喇 加 Pp ps 
Be 


(c) 使 p; 成 为 孤立 节点 (d) 使 pi 成 为 孤立 节点 
图 4-11 RAG 的 化 解 过 程 


2. 死 锁 的 检测 


锁 的 检测 实际 上 是 检查 系统 中 是 否 存在 死 锁 ,并 标 出 哪些 进程 和 资源 牵涉 到 死 锁 。 
主要 是 检查 系统 中 是 否 存在 循环 等 待 条 件 。 下 面 介绍 一 种 基于 RAG 与 死 锁 定理 的 检测 

可 以 通过 化 解 RAG 来 检测 当前 状态 S 是 否 为 死 锁 状态 。 化 解 方 法 如 下 : 

(1) 在 RAG 中 找 一 个 非 孤立 的 进程 节点 p;, 且 这 个 节点 只 有 分 配 边 , 或 虽然 有 请 求 
边 ,但 该 请 求 边 能 立刻 转换 为 分 配 边 , 即 进程 p; 没有 被 阻塞 。 然 后 消去 节点 户 的 全 部 有 向 
边 , 即 释放 进程 p; 所 占有 的 全 部 资源 ,使 其 成 为 一 个 孤立 的 节点 。 

(2) 假定 rs 是 进程 节点 p; 释放 了 的 资源 节点 , 则 另 一 个 进程 节点 p; 关于 x 的 请 求 边 
Pjrt 就 可 转换 为 分 配 边 , 即 进 程 p; 释放 的 资源 又 可 分 配给 进程 p; 使 用 。 如 果 经 一 系列 
转换 后 ,p; 只 有 分 配 边 , 则 使 p; 成 为 一 个 孤立 的 节点 。 

(3) 经 过 一 系列 的 转换 后 , 若 RAG 中 所 有 的 节点 都 变 成 了 孤立 节点 , 则 称 该 RAG 是 
可 完全 化 解 的 ,否则 称 该 RAG 是 不 可 完全 化 解 的 。 

对 于 较 复杂 的 RAG ,可 能 有 不 同 的 化 解 顺序 ,但 所 有 的 化 解 顺序 都 将 得 到 同样 的 不 可 
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化 解 图 或 完全 的 可 化 解 图 。 显 然 不 可 化 解 的 RAG 中 必然 存在 环 路 。 

可 以 证 明 : S 为 死 锁 状态 的 充分 条 件 必 要 是 , 当 且 仅 当 S 状态 的 资源 分 配 图 是 不 可 完 
全 化 解 的 。 该 条 件 称 为 死 锁 定理 。 

例 4-12 在 图 4-11 所 示 的 RAG 中 是 否 存在 死 锁 ? 

解 : 化 解 过 程 如 图 4-11 所 示 。 

在 图 4-11(a) 中 ,首先 找到 节点 ps ,消去 其 所 有 的 有 向 边 ,释放 资源 六 和 ,将 ps 一 rs 
转换 成 7; 一 ps ,形成 图 4-11(b) 所 示 的 情况 ; 然后 ,释放 节点 ps 所 占用 的 资源 r, 和 ,将 
Pi 六 ri 转换 成 一 pi ,形成 图 4-11(c) 所 示 情 况 ; 最 后 RAG 中 所 有 的 节点 都 变 成 了 孤立 的 
节点 ,如 图 4-12(d) 所 示 。 因 此 ,图 4-11(a) 是 可 完全 化 解 的 ,不 存在 死 锁 状 态 。 

如 果 在 图 4-11(a) 中 再 加 入 一 条 有 向 边 ps 一 rs ,那么 该 RAG 是 不 可 化 解 的 ,于 是 状态 S 
为 死 锁 状 态 。 

基于 RAG 与 死 锁定 理 的 死 锁 检测 算法 描述 与 银行 家 算法 非常 类 似 ,在 此 不 再 著述 。 


3. 解除 


一 旦 检测 到 死 锁 , 便 要 立即 设法 解除 。 常 用 的 解除 方法 有 如 下 两 种 : 

(1) 强制 性 地 从 系统 中 撤销 所 有 发 生死 锁 的 进程 ,或 者 选择 一 些 发 生死 锁 的 进程 撤 
销 ,并 和 剥夺 它们 的 资源 给 剩 下 的 进程 使 用 ,直到 死 锁 解 除 。 每 次 选择 撤销 那些 代价 最 小 
的 进程 。 撤 销 的 代价 可 能 是 优先 数 的 改变 或 者 最 短 撤销 路 径 的 寻求 。 这 些 都 需要 较 复 
杂 的 处 理 。 

(2) 使 用 一 个 有 效 的 挂 起 和 解除 挂 起 机 构 来 挂 起 一 些 进 程 ,实质 上 是 从 挂 起 进程 那里 
抢占 资源 以 解除 死 锁 。 需 要 注意 的 是 挂 起 需要 保留 多 个 现场 ,以 便 解 挂 时 能 回 退 到 挂 起 点 
重新 执行 。 


人 7 Linux 进程 调度 


调度 程序 是 多 任务 Linux 操作 系统 的 基础 ,为 了 最 大 限度 地 发 挥 系统 资源 ,Linux 采用 
公平 ,高效 ,简单 的 原则 设计 进程 调度 算法 。 


4.7.1 调度 的 时 机 


调度 的 时 机 是 指 何 时 进行 重新 调度 , 即 重新 分 配 CPU 资源 的 问题 。 为 了 减少 操作 系 
统 设计 的 复杂 性 和 提高 系统 的 执行 效率 ,只 在 几 个 核心 的 位 置 调度 。Linux 的 调度 时 机 主 
要 有 以 下 几 种 。 

(1) 当前 正在 CPU 执行 的 进程 结束 ,或 因 某 种 原因 阻塞 睡眠 时 ,要 重新 调度 。 具 体 说 
就 是 正在 运行 的 进程 执行 exit() 函数 或 sleep() 函数 时 ,这 些 函数 主动 启动 进程 调度 函数 ， 
重新 分 配 CPU 。 

(2) 当 就 绪 队 列 中 增加 一 个 新 进程 时 ,要 重新 调度 。 也 就 是 说 ,正在 执行 的 进程 每 当 调 
用 函数 add_runqueue() 时 要 重新 分 配 CPU 资源 。 在 此 过 程 中 ,新 加 入 的 进程 和 当前 正在 
执行 进程 的 counter 值 如 果 符 合 一 定 条 件 ( 例 如 新 进程 的 counter 值 减 去 当前 进程 的 


第 4 章 ”处 理 机 调度 与 死 锁 





counter 值 大 于 3) ,就 将 调度 标志 need_resched 置 为 1。 当 内 核 校 验 到 调度 标志 为 1 时 便 执 

(3) 当 正 在 执行 的 进程 分 到 的 时 间 片 用 完 时 ,调度 标志 need_resched 置 为 1, 要 重新 调 
度 。 此 种 情况 下 ,调度 执行 的 启动 是 由 时 钟 中 断 引 发 的 。 

(4) 当 进 程 从 执行 系统 调用 返回 到 用 户 态 时 ,要 重新 调度 。 在 系统 调用 返回 时 ,一 般 要 
调用 返回 函数 ret_from_call() ,由 此 函数 检测 调度 状态 ,若是 1, 则 启动 调度 程序 。 

(5) 当 内 核 结 束 中 断 处 理 返 回 用 户 态 时 ,要 重新 调度 。 此 种 情况 也 是 通过 执行 返回 函 
数 检测 调度 标志 的 。 有 时 ,对 于 那些 经 常 响应 和 及 时 处 理 的 中 断 ,为 了 节省 开销 ,并 不 调用 
返回 函数 ,这 时 返回 的 是 被 中 断 的 进程 。 

(6) 直接 执行 调度 程序 。 


4.7.2 调度 策略 


Linux 把 进程 区 分 为 实时 进程 和 普通 进程 ,其 中 普通 进程 进一步 划分 为 交互 式 进程 和 
批 处 理 进程 。Linux 调度 策略 的 基础 是 时 间 片 轮转 和 优先 级 抢占 的 结合 ,为 了 满足 不 同 应 
用 的 需要 ,内 核 提 供 了 3 种 调度 策略 : 

(1) SCHED_FIFO( 先 到 先 服 务 )。 对 于 所 有 相同 优先 级 的 进程 ,最 先进 入 运行 队列 的 
进程 总 能 优先 获得 调度 ; 进程 一 旦 占用 CPU 则 一 直 运 行 ,直到 有 更 高 优先 级 的 任务 到 达 或 
自己 放弃 。 

(2) SCHED_RR( 时 间 片 轮转 )。 该 策略 采用 更 加 公平 的 轮转 策略 , 当 进 程 的 时 间 片 用 
完 时 ,系统 将 重新 分 配 时 间 片 ,并 置 于 就 绪 队列 尾 。 放 在 队列 尾 保证 了 所 有 具有 相同 优先 级 
的 RR 任务 的 调度 公平 。 

(3) SCHED_NORMAL (普通 进程 调度 策略 ,在 Linux 2. 6 内 核 以 前 为 SCHED _ 
OTHER) 。 

用 户 进程 可 以 通过 系统 调用 设 定 自己 的 调度 策略 。 实 时 进程 的 优先 级 由 sys_sched_ 
setschedule() 设 置 。 该 值 不 会 动态 修改 ,而 且 总 是 比 普 通 进程 的 优先 级 高 。 在 进程 描述 符 
中 用 rt_priority 域 表 示 。 


4.7.3 调度 算法 


从 Linux 的 第 1 版 到 Linux 2. 4 内 核 系 列 ,Linux 的 调度 算法 都 采用 了 分 时 动态 优先 级 
的 调度 算法 ,这 个 算法 的 缺点 是 当 内 核 中 有 很 多 任务 时 ,调度 器 本 身 就 会 耗费 不 少时 间 。 所 
以 ,从 Linux 2.5 开始 引入 了 一 种 叫做 O(1) 的 调度 器 ,O(1) 调 度 器 对 于 区 分 交互 式 进程 和 
批 处 理 进 程 的 算法 与 以 前 相 比 昌 大 有 改进 ,但 对 于 一 些 要 求 响应 时 间 的 交互 式 进程 却 反 应 
缓慢 。 从 Linux 2.6 内 核 开 始 ,将 公平 调用 的 概念 引入 ,采用 了 称 为 CFS(Completely Fair 
Scheduling, 完 全 公平 调度 ) 的 调度 算法 。 

对 于 普通 进程 ,Linux 调度 算法 进行 了 不 断 改进 ,主要 经 历 了 3 种 调度 算法 的 演变 。 





1. 分 时 动态 优先 级 的 调度 算法 
在 Linux 2. 4 内 核 系列 中 ,在 创建 进程 时 指定 采用 分 时 调度 策略 ,并 指定 优先 级 nice 值 
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(一 20 一 19) 。 每 个 进程 在 创建 时 都 被 赋予 一 个 时 间 片 counter。 调 度 程序 调用 goodness() 
函数 遍历 就 绪 队 列 中 的 进程 ,计算 每 个 进程 的 动态 优先 级 (counter 十 20 一 nice) ,选择 计算 结 
果 最 大 的 一 个 去 运行 。 时 钟 中 断 递减 当前 运行 进程 的 时 间 片 , 当 这 个 时 间 片 用 完 后 
(counter 减 至 0) 或 者 主动 放弃 CPU 时 ,该 进程 将 被 放 在 就 绪 队 列 TASK_RUNNING 末 
尾 。 当 进程 的 时 间 片 用 完 时 ,调度 程序 必须 重新 赋予 时 间 片 才能 有 机 会 运行 。Linux 2. 4 
调度 程序 保证 只 有 当 所 有 TASK_RUNNING 进程 的 时 间 片 都 被 用 完 之 后 , 才 对 所 有 进程 
重新 分 配 时 间 片 。 如 果 某 个 进程 没有 用 完 其 所 有 的 时 间 片 ,那么 剩余 时 间 片 的 一 半 将 被 添 
加 到 新 时 间 片 ,使 其 在 下 次 调度 中 可 以 执行 更 长 时 间 。 进 程 被 创建 时 子 进程 的 counter 值 
为 父 进程 counter 值 的 一 半 , 这 样 保证 了 任何 进程 都 不 能 依靠 不 断 地 调用 fork() 创 建 子 进 
程 从 而 获得 更 多 的 执行 机 会 。 

调度 程序 选择 进程 时 需要 遍历 整个 TASK_RUNNING 队列 ,从 中 选 出 优先 执行 的 进 
程 ,因此 该 算法 的 执行 时 间 与 进程 数 成 正比 。 另 外 ,每 次 重新 计算 counter 所 花费 的 时 间 也 
会 随 着 系统 中 进程 数 的 增加 而 线性 增长 , 当 进 程 数 很 大 时 ,更 新 counter 操作 的 代价 会 非常 
高 ,导致 系统 整体 的 性 能 下 降 。 


2. 0(1) 的 调度 算法 


从 Linux 2.6 内 核 开 始 采 用 了 O(1) 调 度 算法 。 该 算法 可 以 在 恒定 的 时 间 内 为 每 个 进 
程 重新 分 配 时 间 片 ,而 且 在 恒定 的 时 间 内 可 以 选取 一 个 最 高 优先 级 的 进程 ,重要 的 是 这 两 个 
过 程 都 与 系统 中 可 运行 的 进程 数 无 关 , 这 种 算法 的 复杂 度 为 0(1)。 

O(1) 算 法 中 将 可 运行 态 (TASK_RUNNING) 进 程 分 为 两 类 : 一 类 是 活动 进程 , 即 那些 
还 没有 用 完 时 间 片 的 进程 ; 另 一 类 是 过 期 进程 , 即 那些 已 经 用 完 时 间 片 的 进程 ,在 其 他 进程 
没有 用 完 自 己 的 时 间 片 之 前 ,过 期 进程 不 能 再 被 运行 。 系 统一 共有 140 个 不 同 的 优先 级 , 因 
此 两 类 进程 各 有 140 个 不 同 优先 级 的 进程 链表 。 各 个 队列 还 采用 优先 级 位 示 图 来 标记 每 个 
链表 中 是 否 存在 进程 。 调 度 执行 的 进程 都 会 被 按照 先进 先 出 的 顺序 添加 到 各 自 的 链表 末 
尾 。 每 个 进程 都 有 一 个 时 间 片 ,这 取决 于 系统 允许 执行 这 个 进程 多 长 时 间 。 

调度 程序 的 工作 就 是 在 活动 进程 集合 中 选取 一 个 最 高 优先 级 的 进程 。 需 要 选择 当前 最 
高 优先 级 的 进程 时 ,调度 程序 不 用 遍历 整个 TASK_RUNNING 队列 ,而 是 利用 优先 级 位 图 
从 高 到 低 找到 第 一 个 被 设置 的 位 ,该 位 对 应 着 一 条 进程 链表 ,这 个 链表 中 的 进程 是 当前 系统 
所 有 可 运行 进程 中 优先 级 最 高 的 ,在 该 进程 链表 中 选取 第 一 个 进程 , 即 为 调度 程序 马上 要 执 
行 的 进程 。 

不 同类 型 的 进程 应 该 有 不 同 的 优先 级 。 每 个 进程 与 生 俱 来 ( 即 从 父 进程 那里 继承 而 来 ) 
都 有 一 个 优先 级 , 称 为 静态 优先 级 。 每 次 时 钟 中 断 时 ,进程 的 时 间 片 (time_slice) 被 减 1。 当 
time_slice 为 0 时 ,表示 当前 进程 的 时 间 片 用 完 , 此 时 系统 就 会 为 该 进程 分 配 新 的 时 间 片 ( 即 
基本 时 间 片 ) ,新 的 时 间 片 大 小 由 静态 优先 级 决定 。 静 态 优 先 级 越 高 ( 值 越 低 ) ,进程 得 到 的 
时 间 片 越 长 ,优先 级 低 的 进程 得 到 的 时 间 片 则 较 短 。 进 程 除了 拥有 静态 优先 级 外 , 当 调 度 程 
序 选择 新 进程 运行 时 就 会 使 用 进程 的 动态 优先 级 。 动 态 优先 级 的 生成 是 以 静态 优先 级 为 基 
础 ,再 加 上 相应 的 惩罚 或 奖励 (bonus) 。 这 个 奖励 并 不 是 随机 产生 的 ,而 是 根据 进程 过 去 的 
平均 睡眠 时 间 做 相应 的 惩罚 或 奖励 。 平 均 睡眠 时 间 可 以 用 来 衡量 进程 是 否 是 一 个 交互 式 进 
程 ,交互 性 强 的 进程 会 得 到 调度 程序 的 奖励 (bonus 为 正 ) ,而 那些 一 直 霸 占 CPU 的 进程 会 
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得 到 相应 的 惩罚 (bonus 为 负 ) ,从 而 适当 地 提高 了 交互 进程 的 优先 级 。 

O(1) 调 度 程 序 区 分 交互 式 进程 和 批 处 理 进程 的 算法 与 以 前 相 比 虽 大 有 改进 ,但 仍然 在 
很 多 情况 下 会 失效 。 有 一 些 著 名 的 程序 总 能 让 该 调度 程序 性 能 下 降 ,导致 交互 式 进程 反应 
缓慢 ,对 于 NUMA(Non Uniform Memory Access Architecture, 非 统一 内 存 的 多 处 理 器 架 
构 ) 支 持 也 不 完善 。 该 算法 的 复杂 性 主要 来 自动 态 优先 级 的 计算 ,调度 程序 根据 平均 睡眠 时 
间 和 一 些 很 难 理解 的 经 验 公 式 来 修正 进程 的 优先 级 以 及 区 分 交互 式 进程 ,这 样 的 代码 很 难 
阅读 和 维护 。 





Linux 2. 6. 26 内 核 调度 程序 吸收 了 以 前 版 本 的 精华 ,抛弃 了 动态 优先 级 的 概念 ,遵循 
一 种 完全 公平 的 思想 ,不 再 跟踪 进程 的 睡眠 时 间 ,也 不 再 企图 区 分 交互 式 进 程 。 它 将 所 有 的 
进程 (普通 进程 ) 都 统一 对 待 ,这 就 是 公平 的 含义 。CFS 允许 每 个 进程 运行 一 段 时 间 , 循 环 轮 
转 ,选择 运行 时 间 最 少 的 进程 作为 下 一 个 运行 进程 。 

CFS 在 所 有 可 运行 进程 总 数 基础 上 计算 出 一 个 进程 应 该 运行 多 久 。 

每 个 进程 都 有 一 个 nice 值 ,表示 其 静态 优先 级 ,每 个 nice 值 对 应 一 个 进程 的 权重 。nice 
值 越 小 ,进程 的 权重 越 大 ; nice 值 越 大 ,进程 的 权重 越 小 。 一 个 进程 在 一 个 调度 周期 中 的 运 
行 时 间 为 

分 配给 进程 的 运行 时 间 = 调度 周期 x 进程 权重 / 所 有 进程 权重 之 和 

可 以 看 到 ,进程 的 权重 越 大 ,分 到 的 运行 时 间 越 多 。 

为 确保 每 个 进程 只 在 公平 分 配给 它 的 处 理 机 时 间 内 运行 ,CFS 中 引入 了 虚拟 运行 时 间 
《vruntime) 的 概念 。vruntime 记录 了 一 个 可 执行 进程 到 当前 时 刻 为 止 执行 的 总 时 间 。 

vruntime 十 二 当前 进程 的 运行 时 间 X NICE_0_LOAD/ 进程 权重 

其 中 NICE_0_LOAD 是 一 个 定 值 ,为 系统 默认 的 进程 的 权 值 ; 调度 算法 每 次 选择 vruntime 
值 最 小 的 进程 进行 调度 ,内 核 中 使 用 红 黑 树 可 以 方便 地 得 到 vruntime 值 最 小 的 进程 。 由 
此 ,vruntime 越 大 ,说 明 该 进程 运行 得 越久 ,所 以 被 调度 的 可 能 性 就 越 小 ; 权重 越 大 ， 
vunruntime 增长 越 慢 ,进程 越 会 优先 得 到 执行 。 简 单 来 说 ,一 个 进程 的 优先 级 越 高 ,而 且 该 
进程 运行 的 时 间 越 少 , 则 该 进程 的 vruntime 就 越 小 ,该 进程 被 调度 的 可 能 性 就 越 高 。 

系统 定时 器 周期 性 地 计算 当前 进程 的 执行 时 间 。 时 钟 周期 中 断 函 数 主要 是 更 新 当前 进 
程 的 vruntime 值 和 实际 运行 时 间 值 ,并 判断 当前 进程 在 本 次 调度 中 的 实际 运行 时 间 是 否 超 
过 了 调度 周期 分 配 的 实际 运行 时 间 , 如 果 是 , 则 设置 重新 调度 标志 。 


习题 


. 处 理 机 调度 一 般 分 为 儿 个 级 别 ? 每 级 调度 的 含义 是 什么 ? 
. 一 个 作业 从 进入 系统 到 运行 结束 ,一 般 有 几 个 状态 ? 

. 作业 调度 的 主要 功能 是 什么 ? 

. 进程 调度 的 主要 功能 是 什么 ? 

. 进程 调度 分 几 种 方式 ? 

. 一 般 的 调度 原则 有 哪些 ? 


中 上 
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7. 试 比较 FCFS 和 FS 两 种 调度 算法 。 

8. 在 RR 调度 算法 中 ,时 间 片 的 确定 与 哪些 因素 有 关 ? 

9. 什么 是 静态 优先 级 ? 什么 是 动态 优先 级 ? 

10. 为 什么 说 多 级 反馈 队列 调度 算法 能 较 好 地 满足 各 方面 用 户 的 需要 ? 
11. 判断 实时 任务 处 理 结果 正确 的 条 件 什么 ? 

12. 什么 是 硬 实时 任务 ? 什么 是 软 实时 任务 ? 

13. 一 个 实时 系统 应 具有 哪些 能 力 ? 

14. 什么 是 自 调度 方式 ? 其 主要 优 缺 点 是 什么 ? 

15. 什么 是 组 调度 方式 ? 其 主要 优点 是 什么 ? 

16. 什么 叫 死 锁 ? 产生 死 锁 的 必要 条 件 是 什么 ? 

17. 解决 死 锁 的 常用 方法 有 哪些 ? 

18. 银行 家 算法 有 什么 优 缺 点 ? 

19. 什么 是 死 锁 定理 ? 

20. 生产 者 -消费 者 问题 中 ,如 果 对 调 生 产 者 进程 中 的 两 个 P 操作, 则 可 能 发 生 什么 


21. 假定 有 4 道 作 业 , 它 们 的 到 达 时 间 、 运 行 时 间 ( 单 位 为 ms, 十 进 制 ) 如 表 4-8 所 示 。 
试 计算 在 单 道 作业 多 道 程序 环境 下 ,分别 采用 FCFS 调度 算法 、SF 算法 时 和 HRN 算法 时 ， 
这 四 道 作 业 的 平均 周转 时 间 及 平均 带 权 周转 时 间 ,并 指出 它们 的 调度 顺序 。( 调 度 时 间 忽 略 





不 计 ) 
表 4-8 4 道 作 业 的 到 达 时 间 和 运行 时 间 
作业 号 到 达 时 间 /ms 运行 时 间 /ms 
1 0 交配 
2 0.3 0.5 
3 0.5 0.1 
4 1 0.4 


22. 在 单 CPU 和 两 台 输 入 输出 设备 (11、I2) 的 多 道 程序 环境 下 ,同时 投入 3 个 进程 pi 、 
ps、ps 运行 。 这 3 个 进程 对 CPU 和 输入 输出 设备 的 使 用 顺序 和 时 间 如 下 : 

pi: I2(30ms); CPU(10ms); I1(30ms); CPU(10ms); I2(20ms) 。 

p2: I1(20ms); CPU(20ms); I2(40ms) 。 

ps: CPU(30ms); I1(20ms); CPU(10ms); ICI0ms) 。 

假定 CPU、I11、I2 都 能 并 行 工作 ,进程 户 优先 级 最 高 .ps 次 之 ,ps 最 低 , 且 3 个 进程 的 
优先 级 始终 不 变 。 优 先 级 高 的 进程 可 以 抢占 优先 级 低 的 进程 的 CPU, 但 不 能 抢占 了 和 12。 
试 求 (调度 时 间 忽 略 不 计 ) : 

(1) 3 个 进程 从 投入 到 运行 完成 需要 的 时 间 。 

(2) 从 投入 到 完成 3 个 进程 这 段 时 间 内 CPU 的 利用 率 。 

(3) 输入 输出 设备 的 利用 率 。 

23. 假设 有 一 组 进程 在 相对 时 刻 0 以 pi 、ps、ps、ps、ps 的 次 序 进 入 就 绪 队 列 。 它 们 的 
CPU 周期 和 优先 数 如 表 4-9 所 示 。 
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表 4-9 5 个 进程 的 CPU 周期 和 优先 数 
进程 CPU 周期 优先 数 
pi 10 3 
p: 1 1 
ps 2 a 
ps 1 4 
ps 5 2 





其 中 ,优先 数 越 小 ,表示 优先 级 越 高 。 试 计算 在 采用 非 剥 夺 HPF 调度 算法 时 ,这 组 进 
程 的 平均 周转 时 间 和 平均 带 权 周转 时 间 。 

24. 有 相同 类 型 的 5 个 资源 被 4 个 进程 所 共享 , 且 每 个 进程 最 多 需要 2 个 这 样 的 资源 
就 可 以 运行 完成 。 该 系统 是 否 会 由 于 对 这 种 资源 的 竞争 而 产生 死 锁 ? 

25. 某 系 统 有 rs 和 7s 共 3 种 资源 ,在 Te 时 刻 有 4 个 进程 py、ps、ps 和 ps, 它们 占用 
资源 和 需求 资源 的 情况 如 表 4-10 所 示 。 


表 4-10 4 个 进程 需求 和 占用 资源 的 情况 

















最 大 资源 需求 量 已 分 配 资源 数量 
nn r rs n ra rs 
p 3 2 2 1 0 0 
ps 6 1 3 4 1 1 
ps 3 Wl 4 2 1 1 
ps 4 2 0 0 2 




















此 时 ,系统 可 用 的 资源 向 量 为 (2,1,2)。 
(1) 试 写 出 Te 时 刻 系统 的 资源 分 配 和 矩阵 。 


(2) 如 果 此 时 p 和 ps 均 发 出 资源 请 求 (1,0,1), 为 了 保证 系统 的 安全 性 ,应 该 如 何 分 
配 资源 给 这 两 个 进程 ? 说 明理 由 。 


26. 试 化 解 图 4-12 所 示 的 资源 分 配 图 ,并 利用 死 锁定 理 给 出 相应 的 结论 。 


PN 
本 





n 








Pp 








图 4-12 题 26 的 资源 分 配 图 


27. Linux 提供 了 哪些 调度 策略 ? 
28. Linux 的 调度 算法 是 如 何 演 变 的 ? 
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存储 管理 | 


现代 计算 机 系统 中 的 存储 器 通常 由 内 存 和 外 存 组 成 。 存 储 管理 主要 涉及 的 是 内 存 的 管 
理 , 而 外 存 则 被 看 成 是 内 存 的 直接 延伸 , 故 存储 管理 也 称 作 内 存 管 理 。 

内 部 存储 器 (简称 内 存 , 或 称 主 存 ) 的 管理 是 操作 系统 的 主要 功能 之 一 。 近 年 来 ,存储 器 
容量 虽然 一 直 在 不 断 扩 大 ,但 是 程序 增长 的 速度 和 存储 器 容量 的 增长 一 样 快 ,存储 器 仍然 是 
一 种 宝贵 而 又 紧俏 的 资源 。 因 此 ,对 内 存 的 管理 和 有 效 利用 仍然 是 当今 操作 系统 十 分 重要 
的 内 容 。 

内 存 一 般 被 分 为 两 大 区 域 : 系统 区 和 用 户 区 。 系 统 区 用 于 存放 操作 系统 的 内 核 程序 和 
其 他 系统 常 驻 程序 ,这 些 程序 在 系统 初 启 时 便装 入 系统 区 并 一 直 驻 留 内 存 。 对 一 个 具体 的 
计算 机 系统 ,系统 区 是 固定 的 ,一 般 占据 内 存 的 低地 址 部 分 。 用 户 区 用 以 存放 用 户 程序 和 数 
据 以 及 用 户 态 下 运行 的 系统 程序 , 它 是 用 户 进程 可 共享 的 内 存 区 。 本 章 主要 讨论 用 户 区 的 
管理 。 

各 种 操作 系统 之 间 最 明显 的 区 别 之 一 ,往往 在 于 它们 所 采用 的 存储 管理 方案 不 同 。 目 
前 ,存储 管理 基本 上 可 概括 成 4 种 方案 : 分 区 式 存储 管理 页 式 存储 管理 、 段 式 存储 管理 , 段 
页 式 存储 管理 。 本 章 将 逐一 讨论 各 种 方案 的 基本 思想 和 实现 技术 。 


€.1 存储 管理 基本 概念 


5.1.1 物理 内 存 和 虚拟 存储 空间 
1. 物理 内 存 


物理 内 存 是 由 系统 实际 提供 的 硬件 存储 单元 (通常 为 字 节 ) 组 成 的 ,CPU 可 直接 访问 这 
些 存 储 单元 ,所 有 的 程序 指令 和 数据 必须 装 入 内 存 才能 执行 。 oo 
内 存 中 所 有 的 存储 单元 从 0 开始 依次 编号 ,这 个 编号 称 为 ”00000001H 
这 个 存储 单元 的 内 存 地 址 或 物理 地 址 。CPU 通过 物理 地 址 找 
到 相应 的 存储 单元 中 存放 的 指令 或 数据 。 内 存 的 地 址 空间 是 一 
维 的 , 它 的 大 小 受到 实际 存储 单元 的 限制 ,存储 单元 最 大 的 内 存 003FFFFEH 
地 址 加 1 称 为 内 存 空间 大 小 或 物理 地 址 空间 大 小 。 如 图 5-1 所 0Q3FEFFEH 
示 , 内 存 地 址 编号 00000000H~003FFFFFH( 十 六 进 制 ) 构 成 了 ”图 5-1 4MB 大 小 的 物理 
一 个 4MB 大 小 的 物理 存储 空间 。 地 址 空间 





虽然 内 存 的 访问 速度 快 ,但 其 价格 昂贵 。 因 此 ,一 个 计算 机 系统 中 实际 的 内 存 容量 往往 
有 限 ,不 可 能 存 人 大 量 的 程序 与 数据 ,只 能 暂时 存放 将 要 访问 的 进程 的 程序 段 和 数据 。 而 系 
统 中 大 量 的 程序 和 数据 存 人 价格 较 便宜 的 外 部 存储 器 中 , 待 需要 访问 时 ,再 将 其 调 入 内 存 。 


2. 虚拟 存储 空间 


将 用 户 编写 的 源 程序 变 为 一 个 可 在 内 存 中 执行 的 程序 代码 ,通常 要 经 过 以 下 几 个 步骤 : 
首先 是 编译 ,由 编译 程序 将 用 户 程序 的 源 程序 编译 成 若干 个 目标 模块 ; 其 次 是 链接 ,由 链接 
程序 将 编译 后 的 目标 模块 以 及 它们 所 需要 的 库 函 数 链接 在 一 起 ,形成 一 个 完整 的 可 装 和 人 模 
块 。 这 里 ,链接 既 可 以 是 在 程序 执行 以 前 由 链接 程序 完成 ( 称 为 静态 链接 ) ,也 可 以 是 在 程序 
执行 过 程 中 由 于 需要 而 进行 的 ( 称 为 动态 链接 ); 最 后 由 系统 装 入 程序 将 装 入 模块 装 人 
内 存 。 

那么 ,程序 在 运行 中 要 访问 的 内 存 地 址 该 怎样 给 出 呢 ? 通常 有 两 种 方法 。 一 种 是 由 程 
序 员 在 程序 中 直接 给 出 要 访问 的 数据 或 指令 的 物理 地 址 ,但 在 程序 员 在 给 出 直接 的 物理 地 
址 时 ,不仅 要 求 程序 员 熟 悉 内 存 的 使 用 情况 ,而 且 一 旦 程序 或 数据 被 修改 ,可 能 就 要 改变 程 
序 中 所 有 的 地 址 。 因 此 ,通常 采用 另 一 种 方法 , 即 用 户 用 高 级 语言 或 汇编 语言 进行 编程 时 ， 
源 程序 中 使 用 的 都 是 符号 地 址 ,如 CALL Subprol,GOTO A: 等 ,用 户 不 必 关 心 符号 地 址 在 
内 存 中 的 物理 位 置 。 源 程序 经 过 编译 .链接 后 ,形成 一 个 以 0 地 址 为 起 始 地 址 的 线性 或 多 维 
虚拟 地 址 空间 ,每 条 指令 或 数据 单元 都 在 这 个 虚拟 地 址 空间 中 拥有 确定 的 地 址 ,我们 把 这 个 
地 址 称 为 虚拟 地 址 (virtual address) 或 相对 地 址 。 程 序 运行 时 访问 的 内 存 物 理 地 址 由 地 址 
装 和 人 模块 的 地 址 变换 机 构 完 成 。 

我 们 将 进程 中 的 目标 代码 ,数据 等 的 虚拟 地 址 组 成 的 虚拟 空间 称 为 虚拟 存储 空间 
(virtual memory) 。 虚 拟 存储 空间 不 考虑 物理 内 存 的 大 小 和 信息 存放 的 实际 位 置 ,只 规定 
每 个 进程 中 互相 关连 的 信息 的 相对 位 置 。 与 实际 物理 内 存 只 有 一 个 (单机 系统 中 ) 且 被 所 有 
进程 共享 不 一 样 ,每 个 进程 都 拥有 自己 的 虚拟 存储 空间 , 且 虚 拟 存储 空间 的 容量 是 由 计算 机 
的 地 址 结构 和 寻 址 方式 确定 的 。 例 如 ,直接 寻 址 时 ,如 果 CPU 的 有 效 地址 长 度 是 20 位 ,其 
寻 址 范围 为 0~2”。 采 用 虚拟 存储 空间 技术 使 得 用 户 程 序 空间 和 内 存 空 间 分 离 , 从 而 使 用 
户 程序 不 受 内 存 空 间 大 小 的 限制 ,为 用 户 提供 一 个 比 实际 内 存 更 大 的 虚拟 存储 空间 。 至 于 
如 何 管理 和 实现 虚拟 存储 空间 ,在 后 面 的 有 关 章 节 中 将 有 介绍 。 


5.1.2 存储 管理 的 主要 任务 


在 多 道 的 操作 系统 中 ,允许 多 个 进程 同时 装 和 内存, 通过 进程 的 并 发 执行 来 提高 CPU 
的 利用 率 。 于 是 如 何 将 可 用 内 存 有 效 地 分 配给 多 个 进程 ,如 何 让 对 存储 容量 的 要 求 大 于 可 
用 内 存 的 大 进程 得 以 运行 ,如 何 保护 和 共享 内 存 的 信息 ,等 等 ,是 对 存储 管理 提出 的 一 系列 

现代 操作 系统 中 ,存储 管理 既 要 方便 用 户 , 又 要 有 利于 提高 内 存 的 利用 率 。 存 储 管理 有 
如 下 4 个 主要 任务 。 


1. 内 存 分 配 
内 存 分 配 是 多 道 程序 共享 内 存 的 基础 , 它 要 解决 的 是 如 何 为 多 个 程序 划分 内 存 空间 ,使 
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各 个 程序 在 指定 的 那 一 部 分 内 存 空 间 里 运行 。 为 此 ,操作 系统 必须 随时 掌握 内 存 空间 每 个 
单元 的 使 用 情况 (空闲 还 是 占用 ); 当 有 存储 申请 时 ,根据 需要 选 定 分 配 区 域 ,进行 内 存 分 
配 ; 如 果 占 用 者 不 再 使 用 某 个 内 存 区 域 时 , 则 及 时 收回 该 区 域 。 

内 存 分 配 有 静态 分 配 和 动态 分 配 两 种 方式 。 静态 分 配 是 在 目标 模块 装 和 内存 时 一 次 性 
分 配 进程 所 需 的 内 存 空 间 , 它 不 允许 进程 在 运行 过 程 中 再 申请 内 存 空间 ; 动态 分 配 是 在 目 
标 模块 装 和 内存 时 分 配 进 程 所 需 的 基本 内 存 空 间 , 并 允许 进程 在 运行 过 程 中 申请 附加 的 内 
存 空 间 。 

显然 ,动态 存储 分 配 具有 较 大 的 灵活 性 , 它 不 需要 一 个 进程 在 其 全 部 信息 进入 内 存 后 才 
开始 运行 ,而 是 在 进程 运行 期 间 需 要 某 些 信 息 时 ,系统 才 将 其 自动 调 入 内 存 , 进 程 当前 暂 不 
使 用 的 信息 可 不 进入 内 存 , 这 对 提高 内 存 的 利用 率 大 有 好 处 。 


2. 地 址 变换 





在 多 道 程 序 环境 下 ,要 使 程序 运行 ,必须 为 它 建立 进程 。 建 立 进程 时 ,首先 必须 为 它 分 
配 必要 的 内 存 空 间 , 再 由 装 入 程序 将 其 装 入 内 存 。 而 在 一 般 情况 下 ,一 个 进程 装 入 时 分 配 到 
的 内 存 空间 和 它 的 虚拟 地 址 空间 是 不 一 致 的 。 因 此 , 当 进 程 在 运行 时 ,其 所 要 访问 的 指令 或 
数据 的 实际 物理 地 址 和 虚拟 地 址 是 不 同 的 。 显 然 , 如 果 在 进程 装 入 或 执行 时 不 对 有 关 的 地 
址 部 分 加 以 相应 的 修改 ,将 导致 错误 的 结果 。 为 了 保证 程序 的 正确 执行 , 须 将 程序 的 虚拟 地 
址 转换 为 物理 地 址 ,我们 将 由 虚拟 地 址 到 物理 地 址 的 变换 过 程 称 为 地 址 重 定 位 或 地 址 映射 。 
虚拟 地 址 空间 的 程序 和 数据 经 过 地 址 重 定位 后 ,就 变 成 可 由 CPU 直接 执行 的 绝对 地 址 程 
序 , 其 变换 过 程 如 图 5-2 所 示 。 






































源 程序 一 划一 + 相对 目标 程序 | 地址 亚 定 位 | 绝对 目标 程序 
虚拟 地 址 空间 内 存 空间 


图 5-2 地址 变换 与 存储 空间 


地 址 重 定位 可 分 为 静态 重 定位 和 动态 重 定 位 两 种 方式 。 

(1) 静态 地 址 重 定位 是 在 目标 程序 装 和 指定 的 内 存 区 域 时 由 装配 程序 完成 地 址 的 变 
换 。 例 如 图 5-3 中 一 个 以 0 为 起 始 地 址 的 目标 程序 要 装 入 以 100 为 起 始 地 址 的 存储 空间 。 
显然 ,在 装 入 之 前 要 做 某 些 修改 ,程序 才能 正确 执行 。 例 如 “LOAD 1,1000” 这 条 指令 的 意 
义 是 把 相对 地 址 为 1000 的 存储 单元 内 容 222 装 和 1 号 寄存 器 。 现 在 内 容 为 222 的 存储 单 
元 的 实际 地 址 为 1100, 即 为 相对 地 址 (1000) 加 上 装 入 的 起 始 地 址 (100)。 因 此 ,LOAD 1， 
1000” 这 条 指令 装 和 内存 后 ,其 中 的 直接 地 址 也 要 做 相应 的 修改 ,而 成 为 "LOAD 1,1100”。 
程序 在 装 和 人 内存 时 ,程序 中 涉及 地 址 的 每 条 指令 都 要 进行 这 样 的 修改 ,程序 才 可 执行 。 

静态 地 址 重 定位 的 优点 是 不 需要 硬件 支持 。 但 存在 如 下 缺点 : 一 是 程序 装 入 内 存 后 不 
能 在 内 存 中 移动 ; 二 是 程序 必须 装 人 连续 的 地 址 空间 内 ,不 利于 程序 的 共享 ,也 不 能 充分 利 
用 内 存 空间 。 

(2) 动态 地 址 重 定位 是 指 程序 在 执行 的 过 程 中 ,在 CPU 访问 内 存 地 址 之 前 ,由 地 址 变 
换 机 构 ( 硬 件 ) 来 完成 要 访问 的 指令 或 数据 的 逻辑 地 址 到 物理 地 址 的 转换 。 地 址 变换 机 构 通 
常设 置 一 个 公用 的 基 址 寄存 器 (Base Register,BR) , 它 存 放 现行 进程 在 内 存 空间 的 起 始 地 
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图 5-3 静态 地 址 重 定位 示意 图 


址 。 当 CPU 经 逻辑 地 址 访问 内 存 时 ,地 址 变换 机 构 将 自动 把 该 逻辑 地 址 加 上 BR 中 的 地 址 
以 形成 实际 物理 地 址 。 显 然 , 如 果 程 序 在 内 存 的 存放 位 置 发 生 了 改变 , 则 只 要 改变 BR 的 内 
容 , 就 可 以 正确 地 访问 程序 。 图 5-4 给 出 了 动态 地 址 重 定位 的 实现 示意 。 
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图 5-4 动态 地 址 重 定位 示意 图 


在 图 5-4 中 的 程序 目标 模块 装 入 内 存 时 ,与 地 址 有 关 的 各 项 均 保 持原 来 的 相对 地 址 不 
进行 任何 修改 。 例 如 *LOAD 1,1000” 这 条 指令 在 装 入 内 存 后 ,其 中 要 访问 的 地 址 并 没有 改 
变 ( 仍 是 相对 地 址 1000) 。 当 此 模块 被 操作 系统 调度 到 处 理 机 上 执行 时 ,操作 系统 将 把 此 模 
块 装 和 人 的 实际 起 始 地 址 减 去 目标 模块 的 相对 基地 址 (图 5-4 中 该 基地 址 为 0) ,然后 将 其 差 值 
(100) 装 入 基 址 寄存 器 BR 中 。 当 CPU 执行 “LOAD 1,1000” 指 令 时 ,地 址 变换 机 构 自 动 将 
指令 中 的 相对 地 址 (1000) 与 基 址 寄存 器 中 的 值 (100) 相 加 ,再 把 和 的 值 (1100) 作 为 内 存 绝 对 
地 址 去 访问 该 单元 中 的 数据 。 

由 此 可 见 , 进 行动 态 地 址 重 定位 是 在 指令 执行 过 程 中 每 次 访问 内 存 前 动态 地 进行 的 。 
采取 动态 地 址 重 定位 可 带 来 两 个 好 处 : 

(1) 目标 模块 装 入 内存 时 无 须 任何 修改 ,因而 装 和 人 之 后 再 搬迁 也 不 会 影响 其 正确 运行 ， 
这 对 于 后 面 将 要 介绍 的 存储 器 紧缩 .解决 碎片 问题 是 极其 有 利 的 。 

(2) 一 个 程序 由 多 个 相对 独立 的 目标 模块 组 成 时 ,每 个 目标 模块 各 装 和 人 一 个 存储 区 域 ， 
这 些 存储 区 域 可 以 不 是 顺序 相 邻 的 ,只 要 各 个 模块 有 自己 对 应 的 定位 存储 器 就 行 。 

动态 地 址 重 定 位 技术 所 付出 的 代价 是 需要 硬件 支持 。 


3. 内 存 信息 的 共享 和 保护 
内 存 信息 的 共享 与 保护 也 是 内 存 管理 的 重要 功能 之 一 。 在 多 道 程序 设计 环境 下 ,内 存 
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中 的 许多 用 户 程序 或 系统 程序 和 数据 段 可 供 不 同 的 用 户 进程 共享 ,这 种 资源 共享 将 会 提高 
内 存 的 利用 率 。 但 是 , 反 过 来 说 ,除了 被 允许 共享 的 部 分 之 外 ,又 要 限制 各 进程 只 在 自己 的 
存储 区 活动 ,各 进程 不 能 对 别 的 进程 的 程序 和 数据 段 产生 干扰 和 破坏 ,因此 必须 对 内 存 中 的 
程序 和 数据 段 采 取保 护 措施 。 

下 面 介绍 几 种 常用 的 内 存 信息 保护 方法 。 

(1) 上 下 界 保护 法 。 这 是 一 种 常用 的 硬件 保护 法 。 该 技术 要 求 为 每 个 进程 设置 一 对 上 
下 界 寄存 器 ,其 中 装 有 被 保护 程序 和 数据 段 的 起 始 地 址 和 终止 地 址 。 在 程序 执行 过 程 中 ,在 
对 内 存 进行 访问 操作 时 首先 进行 访 址 合法 性 检查 , 即 检查 经 过 重 定位 后 的 内 存 地 址 是 否 在 上 
下 界 寄存 器 所 规定 的 范围 之 内 ,若是 , 则 访问 是 合法 的 ,否则 是 非法 的 ,并 产生 访 址 越界 中 断 。 

(2) 保护 键 法 。 该 方法 为 每 一 个 被 保护 存储 块 分 配 一 个 单独 的 保护 键 , 保 护 键 可 设置 
成 对 读 写 同时 保护 ,也 可 设置 成 只 对 读 或 写 进行 单项 保护 。 在 程序 状态 字 (PSW) 中 设置 相 
应 的 保护 键 开 关 字 节 , 对 不 同 的 进程 赋予 不 同 的 开关 代码 ,与 被 保护 的 存储 块 中 的 保护 键 相 
匹配 。 如 果 开 关 字 中 的 代码 与 保护 键 匹配 或 存储 块 未 受到 保护 , 则 允许 访问 该 存储 块 , 否 则 
将 产生 访问 出 错 中 断 。 例 如 ,在 图 5-5(Ca) 所 示 的 内 存 状态 中 ,保护 键 0 就 是 对 2 一 4KB 的 存 
储 区 进行 读 写 同时 保护 的 ,而 保护 键 2 则 只 对 4 一 6KB 的 存储 区 进行 读 保护 ,保护 键 3 只 对 
6 一 8KB 的 存储 区 进行 写 保护 。 假 设 当前 的 程序 状态 字 为 2, 图 5-5(b) 给 出 了 采用 保护 键 法 
的 一 些 合法 访问 指令 与 非法 访问 指令 实例 。 其 中 ,对 于 指令 “LOAD 1, 5000” 与 “STORE 
2，5200”, 它 们 访问 的 内 存 存储 单元 的 保护 键 为 2, 与 当前 的 程序 状态 字 (2) 相 匹配 ,所 以 是 
合法 指令 ; 对 于 指令 "LOAD 2, 7000”, 虽 然 它 访问 的 存储 单元 (6 一 8SKB) 的 保护 键 为 3, 与 
当前 的 状态 字 不 匹配 ,但 是 存储 单元 6 一 8SKB 保护 是 写 保护 ,因此 可 以 读 ; 对 于 指令 “LOAD 
1，2500" 与 “STORE 1, 7000”, 它 们 访问 的 存储 单元 的 保护 键 与 当前 的 状态 字 不 匹配 ,同时 
访问 的 存储 单元 的 保护 分 别 有 读 写 保 护 与 写 保护 ,因此 是 非法 指令 。 












































内 存 
合法 的 访问 : 
8 ol LOAD 1, 5000 
4KB STORE 2, 5200 
2| R LOAD 2, 7000 
由 非法 的 访问 
gKB LOAD ”1，2500; 读 写 保护 
STORE 1，7000; 写 保护 
(a) 内 存 状 态 (b) 合法 与 非法 访问 


5-5 ”保护 键 法 


(3) 界限 寄存 器 与 CPU 的 用 户 态 或 核心 态 工作 方式 相 结合 的 保护 方式 。 在 这 种 保护 
模式 下 ,用 户 态 进程 只 能 访问 那些 在 界限 寄存 器 所 规定 范围 内 的 内 存 部 分 ,而 核心 态 进程 则 
可 以 访问 整个 内 存 地 址 空间 。UNIX 系统 就 采用 了 这 种 内 存 保护 方式 。 


4. 内 存 扩充 
为 了 满足 大 进程 的 存储 请 求 , 内 存 管 理应 该 能 够 在 内 存 中 存放 尽 可 能 多 的 用 户 进程 ,给 
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它们 分 配 得 以 运行 的 足够 的 内 存 空 间 , 从 而 提高 整个 系统 的 使 用 效率 。 但 是 ,实际 计算 机 的 
内 存 容量 是 有 限 的 ,这 就 要 求 计算 机 系统 提供 “扩充 的 内 存 ”, 以 保证 内 存 分 配 的 需要 。 这 种 
扩充 不 是 指 物理 内 存 的 扩充 ,而 是 指 利用 存储 管理 软件 为 用 户 程序 提供 一 个 比 实际 内 存 容 
量 更 大 的 逻辑 存储 空间 , 即 所 谓 的 虚拟 存储 技术 。 

事实 上 ,上 述 4 个 任务 也 是 存储 管理 要 解决 的 4 个 基本 问题 ,各 种 存储 管理 方案 都 是 以 
它们 作为 基本 的 出 发 点 。 内 存 分配 、 地 址 变换 、 内 存 保护 是 任何 管理 方案 必须 实现 的 ,比较 
完善 的 管理 方案 则 实现 了 内 存 扩 充 。 


G3 分 区 式 存储 管理 


分 区 式 存储 管理 是 满足 多 道 程序 设计 的 最 简单 的 一 种 存储 管理 技术 。 分 区 的 基本 思想 
是 将 内 存 区 域 划 分 成 若干 个 大 小 不 等 的 区 域 ,每 个 区 域 称 为 一 个 分 区 ,每 个 分 区 存放 一 道 进 
程 对 应 的 程序 和 数据 ,使 进程 在 内 存 中 占用 一 个 分 区 ,而 且 进 程 只 能 在 所 在 分 区 内 运行 。 分 
区 可 分 为 固定 式 和 可 变 式 两 类 。 


5.2.1 固定 分 区 


固定 分 区 是 指 在 用 户 进程 装 入 之 前 ,系统 或 系统 操作 员 将 用 户 空间 划分 为 若干 个 固定 
大 小 的 区 域 ,每 个 进程 占用 一 个 分 区 ,划分 好 的 分 区 大 小 和 个 数 在 整个 系统 运行 期 间 不 会 变 
化 ,因此 也 称 为 静态 分 区 。 

系统 对 内 存 的 管理 和 控制 通过 数据 结构 一 一 分 区 说 明 表 来 实现 的 。 分 区 说 明 表 中 的 每 
个 表 项 记载 一 个 分 区 的 特性 ,包括 分 区 号 、 分 区 大 小 、 分 区 起 始 地 址 和 状态 (已 分 配 用 1 表 
示 , 空 闲 用 0 表示)。 内 存 的 分 配 与 释放 、 存 储 保护 以 及 地 址 变换 等 都 是 通过 分 区 说 明 表 进 
行 的 。 分 区 说 明 表 存放 在 系统 区 内 ,不 能 由 用 户 改动 。 图 5-6 给 出 了 分 区 说 明 表 和 其 对 应 
的 内 存 状 态 示例 。 
























































操作 系统 
20K | 一 
进程 A(6KB) 1 分 区 
28K CL 
2 分 区 
局 - 60K 
| 分 区 号 | 分 区 大 小 | 起 始 地 址 | 状态 进程 BGSKB) 
| 1 8KB 20K | 1 3 分 区 
| 2 | 32KB | 28k | 0 ,GB 
[3 64KB 60k | 1 4 区 
| 4 132KB | l24K | 0 ge 
(a) 分 区 说 明 表 (b) 内 存 空间 分 配 情 况 


图 5-6 固定 分 区 示例 
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从 图 5-6 可 以 看 出 ,2、4 分 区 为 空闲 区 ,8KB 的 1 分 区 被 6KB 的 进程 A 占用 ,有 2KB 内 
存 未 被 使 用 (图 中 阴影 部 分 ) ,64KB 的 3 分 区 被 35KB 的 进程 B 占用 ,也 留 有 29KB 内 存 未 
被 使 用 ,分 区 内 这 些 未 被 使 用 的 无 效 的 存储 空间 称 为 内 碎片 。 内 碎片 的 存在 降低 了 内 存 空 
间 的 利用 率 , 有 时 会 造成 内 存 空间 的 极 大 浪费 。 

当 一 个 进程 要 求 分 配 内 存 时 ,系统 依次 查找 分 区 说 明 表 中 的 表 项 ,将 分 区 大 小 满足 进程 
请 求 容量 并 且 状 态 为 0 的 空闲 分 区 分 配给 该 进程 ,修改 该 分 区 对 应 的 表 项 , 置 状 态 为 1。 进 
程 运 行 完 毕 后 ,系统 将 进程 释放 的 分 区 收回 ,分 区 表 项 对 应 的 状态 置 为 0。 

固定 分 区 管理 能 使 多 个 进程 共享 内 存 , 具 有 数据 结构 简单 .分配 和 回收 算法 容易 实现 等 
优点 。 但 是 ,存在 小 进程 占据 大 分 区 造成 内 碎片 和 可 调和 人 的 进程 大 小 受到 分 区 大 小 限制 等 
问题 。 例 如 ,图 5-6 中 ,车 进程 C 需要 135KB 内 存 , 虽 然 所 有 的 空闲 区 总 和 大 于 135KB, 但 
进程 C 也 分 配 不 到 内 存 , 因 为 没有 一 个 分 区 的 大 小 大 于 或 等 于 135KB。 


5.2.2 可 变 分 区 
1. 可 变 分 区 基本 思想 





可 变 分 区 是 指 在 装 入 进程 的 过 程 中 ,根据 进程 的 实际 需要 建立 分 区 ,该 分 区 的 大 小 正好 
等 于 进程 的 大 小 。 随 着 系统 的 运行 ,内 存 中 的 分 区 大 小 和 个 数 都 会 发 生变 化 ,因此 ,可 变 分 

系统 初 起 时 ,内 存 中 除 操作 系统 区 之 外 ,其 余 内 存 空间 为 一 个 完整 的 大 空闲 区 。 当 有 进 
程 要 求 装 入 运行 时 ,从 该 空闲 区 中 划分 一 块 与 进程 大 小 一 样 的 区 域 分 配给 该 进程 。 当 系统 
运行 一 段 时 间 后 ,经 过 一 系列 的 分 配 与 回收 ,原来 的 一 整 块 大 空闲 区 形成 了 若干 个 占用 区 和 
空闲 区 相间 的 布局 。 

图 5-7 是 一 个 可 变 分 区 分 配 和 回收 的 示例 。 图 5-7 (a) 是 某 时 刻 内 存 状态 ,此 时 ,内 存 
中 装 入 了 A、B、C 3 个 进程 ,同时 又 有 进程 D 和 进程 请 求 装 入; 图 5-7(b) 中 系统 为 进程 D 
分 配 一 块 内 存 区 ,此 时 ,内 存 中 剩 下 了 两 块 较 小 的 空闲 区 ,进程 的 需要 不 能 满足 ; 图 5-7(c) 
表示 进程 A 和 C 已 完成 ,系统 回收 了 它们 占用 的 分 区 ,在 进行 了 适当 的 合并 后 ,内 存 中 形 
成 了 3 块 空闲 区 ,它们 的 总 容量 虽然 远大 于 进程 的 需求 量 ,但 每 块 容量 均 小 于 进程 下 
的 容量 , 故 系统 仍 不 能 为 进程 下 实施 分 配 。 从 图 5-7 可 以 看 出 , 随 着 内 存 分 配 和 回收 的 增 
加 ,分 区 之 间 出 现 了 一 些 较 小 的 空闲 区 ,而 这 些 空闲 区 将 无 法 分 配给 进程 使 用 ,这 种 分 区 
之 间 的 无 效 的 空闲 区 称 为 外 碎片 。 解 决 外 碎片 的 办 法 是 进行 碎片 的 “拼接 ”, 即 把 所 有 空 
闲 区 碎片 合并 成 一 个 连续 的 大 空闲 区 。 拼 接 可 以 选择 在 以 下 时 机 进行 : 当 回收 某 个 占用 
区 时 ,如 果 它 没有 邻接 空闲 区 ,但 内 存 中 有 其 他 空闲 区 , 则 马上 进行 拼接 ; 当 需 要 为 新 进 
程 分 配 内 存 空 间 , 但 找 不 到 足够 的 容纳 该 进程 的 空闲 区 ,而 所 有 空闲 区 总 容量 却 能 满足 
需求 时 ,再 进行 拼接 。 实 际 中 ,使 用 后 者 较 多 ,在 拼接 过 程 中 被 移动 了 的 进程 需要 进行 重 
定位 ,这 可 用 动态 地 址 重 定位 来 实现 。 昌 然 拼 接 技术 可 以 解决 碎片 问题 ,但 拼接 工作 需 
要 大 量 的 系统 开销 ,在 拼接 时 必须 停止 所 有 其 他 工作 ,对 于 分 时 系统 ,拼接 将 损害 系统 的 
响应 时 间 。 



























































进程 D(70KB 进程 E40KB)| 
乡 乡 乡 
操作 系统 进程 EC40KB) 操作 系统 操作 系统 
进程 A(16KB) 进程 A(16KB) 
(26KB) 
(10KB) (IOKB) 
进程 B(90KB) 进程 B90KB) 进程 B(90KB) 
进程 C(30KB) 进程 C(30KB) (30KB) 
进程 D(70KB) 进程 D(70KB) 
(94KB) 
(24KB) (24KB) 
(a) 某 时 刻 内 存 状态 (b) 加 入 进程 D (0) 撤销 进程 A、C 


图 5-7 可 变 分 区 示例 


2. 分 区 使 用 的 数据 结构 


为 了 实现 分 区 分 配 ,系统 中 必须 配置 相应 的 数据 结构 ,用 来 描述 空闲 分 区 和 已 分 配 分 区 
的 情况 ,为 分 配 提供 依据 。 常 用 的 数据 结构 有 以 下 两 种 形式 : 

(1) 分 区 分 配 表 。 用 于 记录 每 个 已 分 配 分 区 的 情况 。 每 个 分 区 占 一 个 表 目 , 表 目 中 包 
括 分 区 号 .起 始 地 址 及 分 区 大 小 等 数据 项 。 

(2) 空闲 分 区 链 ( 表 )。 为 了 实现 对 空闲 分 区 的 分 配 和 链接 ,在 每 个 分 区 的 起 始 部 分 设 
置 一 些 用 于 控制 分 区 分 配 的 信息 以 及 用 于 链接 各 分 区 所 用 的 前 后 指针 ,在 分 区 尾部 则 设置 
一 个 后 向 指针 ,通过 前 、 后 向 链接 指针 ,可 将 所 有 的 空闲 分 区 链接 成 一 个 双向 链 。 


3. 分 区 分 配 算法 


为 把 一 个 新 进程 装 和 内存, 须 按照 一 定 的 分 配 算法 ,从 空闲 分 区 链 中 选 出 一 个 分 区 分 配 
给 该 进程 。 目 前 常用 以 下 几 种 分 配 算法 。 

(1) 首次 适应 算法 。 该 算法 要 求 空 闪 分 区 链 以 地 址 递增 的 次 序 链接 。 在 分 配 内 存 时 ， 
从 链 首 开始 顺序 查找 ,直至 找到 一 个 大 小 能 满足 要 求 的 空闲 分 区 为 止 ; 然后 再 按照 进程 的 
大 小 ,从 该 分 区 中 划 出 一 块 内 存 空间 分 配给 请 求 者 ,余下 的 空闲 分 区 仍 留 在 空闲 分 区 链 中 。 
若 从 链 首 直至 链 尾 不 能 找到 一 个 满足 要 求 的 分 区 , 则 此 次 内 存 分 配 失败 。 该 算法 倾向 于 优 
先 利用 内 存 中 低 址 部 分 的 空闲 分 区 ,从 而 保留 了 高 址 部 分 的 大 空闲 分 区 。 这 为 向 以 后 到 达 
的 大 进程 分 配 大 的 内 存 空间 创造 了 条 件 。 其 缺点 是 低 址 部 分 不 断 被 划分 ,会 留 下 许多 难以 
利用 的 、 很 小 的 空闲 分 区 ,而 每 次 查找 又 都 是 从 低 址 部 分 开始 的 ,这 无 疑 会 增加 查找 可 用 空 
闲 分 区 时 的 开销 。 

(2) 循环 首次 适应 算法 。 该 算法 是 由 首次 适应 算法 演变 而 成 的 。 在 为 进程 分 配 内 存 空 
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间 时 ,不 再 是 每 次 都 从 链 首开 始 查找 ,而 是 从 上 次 找到 的 空闲 分 区 的 下 一 个 空闲 分 区 开始 查 
找 ,直至 找到 一 个 能 满足 要 求 的 空闲 分 区 ,从 中 划 出 一 块 与 请 求 大 小 相等 的 内 存 空间 分 配给 
进程 。 为 实现 该 算法 ,应 设置 一 个 起 始 查找 指针 ,用 于 指示 下 一 次 起 始 查找 的 空闲 分 区 ,并 
采用 循环 查找 方法 , 即 如 果 最 后 一 个 ( 链 尾 ) 空 闲 分 区 的 大 小 仍 不 能 满足 要 求 , 则 应 返回 到 第 
一 个 空闲 分 区 ,看 其 大 小 是 否 满足 要 求 。 找 到 后 ,应 调整 起 始 查找 指针 。 该 算法 能 使 内 存 中 
的 空闲 分 区 分 布 得 更 均匀 ,从 而 减少 了 查找 空闲 分 区 时 的 开销 ,但 这 样 难以 保留 大 的 空闲 
分 区 。 

(3) 最 坏 适 应 算法 。 该 算法 要 求 空闲 分 区 按 其 容量 以 从 大 到 小 的 顺序 形成 一 个 空闲 分 
区 链 。 分 配 时 , 先 检查 空闲 分 区 链 中 的 第 一 个 空闲 分 区 , 若 它 的 大 小 不 满足 要 求 , 则 分 配 失 
败 ; 否则 从 该 分 区 中 划 出 进程 所 要 求 大 小 的 一 块 内 存 空间 分 配给 进程 ,余下 的 空闲 分 区 则 
重新 排列 后 插入 空闲 分 区 链 。 最 坏 适应 算法 的 特点 是 ,总 是 挑选 满足 进程 要 求 的 最 大 分 区 
分 配给 进程 ,这 样 使 分 给 进程 后 剩 下 的 空闲 分 区 也 比较 大 ,也 能 装 下 其 他 的 进程 。 但 是 由 于 
最 大 的 空闲 分 区 总 是 首先 被 划分 , 当 以 后 有 大 的 进程 到 来 时 ,其 申请 的 存储 空间 往往 不 能 得 
到 满足 。 

(4) 最 佳 适应 算法 。 所 谓 * 最 佳 ? 是 指 每 次 为 进程 分 配 内 存 时 ,总 是 把 能 满足 要 求 同 时 
又 是 最 小 的 空闲 分 区 分 配给 进程 ,避免 “大 材 小 用 ”。 为 了 加 速 寻找 ,该 算法 要 求 将 所 有 的 空 
闲 分 区 按 其 容量 以 从 小 到 大 的 顺序 形成 一 个 空闲 分 区 链 。 这 样 , 第 一 次 找到 的 能 满足 要 求 
的 空闲 分 区 必然 是 最 佳 的。 孤立 地 看 ,最 佳 适应 算法 似乎 是 最 佳 的 ,然而 在 宏观 上 却 不 一 
定 。 因 为 每 次 分 配 后 所 切割 下 来 的 剩余 部 分 总 是 最 小 的 ,这 样 , 在 内 存 中 会 留 下 许多 难以 利 
用 的 小 空闲 分 区 。 

(5) 快速 适应 算法 。 也 称 为 分 类 搜索 法 ,为 每 一 类 具有 相同 容量 的 空闲 分 区 设立 一 个 
空闲 分 区 链表 ,每 个 链表 的 表 头 指针 放 在 一 个 索引 表 中 。 在 分 配 内 存 时 ,根据 进程 要 求 的 内 
存 大 小 从 索引 表 中 找到 最 小 的 能 容纳 进程 的 空闲 分 区 链 , 从 链 中 取 下 第 一 块 空闲 分 区 分 配 。 
该 算法 的 优点 是 ,分 配 时 不 会 对 分 区 进行 分 割 ,保留 大 的 分 区 ,不 会 产生 碎片 ,查找 效率 高 。 
其 缺点 是 合并 算法 复杂 。 

(6) 伙伴 系统 算法 。 也 称 Buddy 算法 ,把 内 存 中 的 所 有 空闲 分 区 按照 2 (1k<n) 的 
大 小 划分 ,划分 后 形成 了 大 小 不 等 的 存储 区 ,所 有 相同 的 空闲 分 区 形成 一 个 链 。 在 某 进 程 请 
求 分 配 m 大 小 的 内 存 时 ,首先 计算 i 使 2“!<m 二 2 ,然后 在 2’ 空闲 分 区 链 中 搜索 。 若 空闲 
分 区 链 不 为 空 ,分 配 一 个 空闲 分 区 给 请 求 的 进程 。 若 没有 , 则 查询 2 ”空闲 分 区 链 , 若 有 
2 大 小 的 空闲 分 区 , 则 把 该 空闲 分 区 分 为 两 个 相等 的 分 区 ,这 两 个 分 区 称 为 一 对 伙伴 。 伙 
伴 必须 是 从 同一 个 大 分 区 中 分 离 出 来 的 ,其 中 一 个 用 于 分 配 , 另 一 个 加 入 2 的 空闲 分 区 链 
中 。 若 大 小 为 2 后 :的 空闲 分 区 也 为 空 , 则 需 找 大 小 为 2 的 空闲 分 区 ,在 找到 可 利用 的 空闲 
分 区 后 , 则 进行 两 次 分 割 ,一 个 用 于 分 配 ,一 个 加 入 2 一 的 空闲 分 区 链 中 ,一 个 加 入 2 的 空 
闲 分 区 链 中 ,以 此 类 推 。 一 次 分 配 可 能 要 进行 多 次 分 割 才能 完成 。 在 内 存 分 区 释放 时 ,检查 
是 否 有 空闲 的 伙伴 ,如 果 有 则 合并 ,因此 一 次 释放 也 可 能 要 进行 多 次 合并 。 伙 伴 系统 算法 可 
以 使 内 存 空 闲 分 区 以 各 种 尺寸 再 分 配 , 最 大 限度 地 解决 了 内 存 分 配 引起 的 外 碎片 问题 。 但 
是 不 可 避免 地 存在 内 碎片 问题 。 在 分 割 与 合并 分 区 时 需要 额外 的 系统 开销 。 

(7) 哈 希 算法 。 构 建 一 张 以 空闲 分 区 大 小 为 关键 字 的 哈 希 表 , 该 表 的 每 一 个 表 项 记录 
了 一 个 对 应 的 空闲 分 区 链表 头 指针 。 当 分 配 内 存 时 ,以 空 闵 分 区 的 大 小 为 参数 ,经 过 哈 希 函 








数 计算 得 到 的 
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值 ,为 相应 空闲 分 区 在 哈 希 表 中 的 位 置 ,从 而 快速 的 实现 内 存 分 配 。 


4. 分 区 分 配 与 回收 操作 


1) 分 配 内 存 


当 一 个 进 


程 要 求 装 入 内 存 时 ,系统 将 利用 某 种 分 配 算法 从 空闲 分 区 链 ( 表 ) 中 找到 所 需 


大 小 的 分 区 ,为 进程 分 配 内 存 空 间 。 假 设 请 求 的 分 区 大 小 为 u. size, 空 闲 分 区 链 中 每 个 空闲 


分 区 的 大 小 可 
分 区 的 大 小 )， 


表示 为 m. size。 若 m. size 一 u. size 志 size(size 是 事先 规定 的 不 再 切割 的 剩余 
说 明 多 余部 分 太 小 ,可 不 再 分 割 ,将 整个 分 区 分 配给 请 求 者 ; 否则 ( 即 多 余部 


分 超过 size) ,从 该 分 区 中 按 请 求 的 大 小 划分 出 一 块 内 存 空间 分 配 出 去 ,余下 的 部 分 仍 留 在 


空闲 分 区 链 中 





。 然 后 ,将 分 配 的 分 区 的 首 址 返回 给 调用 者 。 图 5-8 给 出 了 内 存 分 配 流程 。 


从 头 开 始 查 表 


一 GE) 


继续 检索 下 一 个 表 项 | 一 



























时 
N 


从 该 分 区 中 划 出 
u.size 大 小 的 分 区 


1 
将 该 分 区 从 链 中 移出 


























将 该 分 区 分 配给 请 求 者 ， 
修改 有 关 数据 结构 


图 5-8 内 存 分 配 流程 











2) 回收 内 存 


当 进 程 运 


行 完 毕 释放 内 存 时 ,系统 根据 回收 区 的 首 址 从 空闲 分 区 链 中 找到 相应 的 插入 


点 ,此 时 可 能 出 现 以 下 4 种 情况 之 一 : 
(1) 回收 区 与 插入 点 的 前 一 个 空闲 分 区 Fl 相 邻 接 , 见 图 5-9(a)。 此 时 应 将 回收 区 与 插 


入 点 的 前 一 分 
区 Fl 的 大 小 。 
(2) 回收 





区 Fl 合并 ,不 必 为 回收 区 在 空闲 分 区 链 中 分 配 新 表 项 ,而 只 需 修改 其 前 一 分 


区 与 插入 点 的 后 一 空闲 分 区 F2 相 邻 接 , 见 图 5-9(b)。 此 时 也 可 将 两 分 区 合 


并 ,形成 新 的 空闲 分 区 ,但 用 回收 区 的 首 址 作为 新 空闲 分 区 的 首 址 ,分 区 大 小 为 两 者 之 和 。 





(3) 回收 
此 时 将 3 个 分 


区 同时 与 插入 点 的 前 一 空闲 分 区 Fl 和 后 一 空闲 分 区 F2 相 邻接 , 见 图 5-9(c) 。 
区 合并 ,使 用 Fl 的 表 项 和 F1 的 首 址 ,取消 F2 的 表 项 ,分 区 大 小 为 三 者 之 和 。 


(4) 回收 区 既 不 与 Fl 邻接 ,又 不 与 F2 邻接 。 这 时 应 为 回收 区 单独 建立 一 个 新 表 项 , 填 


写 回收 区 的 首 





址 和 大 小 ,并 根据 其 首 址 插入 到 空闲 分 区 链 中 的 适当 位 置 。 
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Fl Fl 
回收 区 回收 区 回收 区 
F2 F2 
(a) 情况 一 (b) 情况 二 (0) 情况 三 


图 5-9 内 存 回收 时 的 情况 


5.2.3 地 址 变换 与 内 存 保护 


对 于 分 区 管理 ,也 同样 存在 每 个 用 户 可 以 自由 编程 的 虚拟 空间 ,因此 在 程序 装 入 内 存 
时 ,可 采用 静态 重 定位 技术 或 动态 重 定位 技术 来 完成 程序 的 地 址 重 定位 。 固 定式 分 区 通常 
采用 静态 方式 。 但 对 于 可 变 式 分 区 ,如果 采 用 拼接 技术 进行 分 区 的 合并 , 则 不 适合 采用 静态 
重 定位 技术 。 

分 区 的 保护 可 采用 界限 寄存 器 法 或 保护 键 法 。 采 用 界限 寄存 器 法 ,一 般 设 置 一 对 公用 
界限 寄存 器 : 基 址 寄存 器 (BR) 和 限 长 寄存 器 (Limit Register,LR) ,它们 分 别 存放 现行 进程 
的 分 区 界限 值 , 即 分 区 的 起 始 地 址 和 大 小 。 也 可 以 设置 多 对 界限 寄存 器 ,每 一 对 界限 寄存 器 
对 应 一 个 分 区 。 利 用 界限 寄存 器 可 同时 实现 对 分 区 的 地 址 变换 和 保护 ,如 图 5-10 所 示 。 
即 ,假设 CPU 要 访问 的 逻辑 地 址 为 LA。 若 LA 二 LR, 则 说 明 地 址 越界 ,将 产生 保护 性 地 址 
越界 中 断 ,系统 转 出 错 处 理 ; 若 LA 二 LR, 则 LA 与 BR 中 的 基 址 形成 有 效 的 物理 地 址 。 


内 存 空间 
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图 5-10 分 区 管理 的 地 址 变换 和 保护 


5.2.4 分 区 式 存储 管理 的 优 缺 点 


分 区 式 存储 管理 的 主要 优点 如 下 : 

(1) 实现 了 多 个 作业 或 进程 对 内 存 的 共享 ,有 助 于 多 道 程序 设计 ,从 而 提高 了 系统 的 资 
源 利用 率 。 

(2) 要 求 的 硬件 支持 少 , 管 理 算法 简单 ,因而 实现 容易 。 

其 主要 缺点 如 下 : 
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(1) 内 存 利用 率 仍然 不 高 。 存 在 着 严重 的 零碎 空闲 分 区 (碎片 ) 不 能 利用 的 问题 。 

(2) 作业 或 进程 的 大 小 受 分 区 大 小 控制 ,除非 配合 采用 覆盖 和 交换 技术 来 实现 内 存 的 
扩充 。 

(3) 难以 实现 各 分 区 间 的 信息 共享 。 
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在 分 区 式 存储 管理 方案 中 ,一 个 进程 总 占用 一 块 连续 的 内 存 区 域 ,因此 产生 了 碎片 问 
题 。 虽 然 采 用 拼接 技术 可 以 使 零散 的 碎片 连 成 一 片 , 但 要 花费 大 量 的 处 理 机 时 间 。 为 了 更 
好 地 解决 碎片 问题 ,人 们 提出 了 另 一 种 内 存 管理 方案 , 即 页 式 存储 管理 方案 。 该 管理 方案 将 
使 一 个 进程 可 以 存放 在 不 连续 的 内 存 区 域 中 。 

页 式 存储 管理 方案 分 为 两 种 : 静态 页 式 存储 管理 方案 和 动态 页 式 存 储 管理 方案 。 


5.3.1 静态 页 式 存 储 管理 
1. 基本 思想 


系统 首先 把 内 存 的 存储 空间 划分 成 若干 个 大 小 相等 的 小 区 域 ,每 个 小 区 域 称 为 页 面 或 
内 存 块 ,页 面 按 0,1,2,… 依 次 编号 。 同 样 ,每 个 进程 的 虚拟 地 址 空间 也 被 分 成 若干 个 与 页 
面 大 小 相等 的 多 个 片段 , 称 之 为 页 ,编号 为 0,1,2,…。 分 配 内 存 时 ,进程 的 每 一 个 页 装 入 内 
存 的 一 个 页 面 。 同 一 进程 的 多 个 页 可 以 分 配 在 编号 不 连续 的 内 存 内 。 

静态 页 式 存储 管理 又 称 为 简单 页 式 存储 管理 , 它 的 特点 是 : 系统 如 能 满足 一 个 进程 所 
要 求 的 全 部 页 面 数 ,此 进程 才能 被 装 入 内 存 , 和 否则 ,不 为 它 分 配 任何 内 存 。 


2. 数据 结构 


在 分 页 式 存储 管理 方案 中 ,系统 使 用 了 页 表 、 请 求 表 、 存 储 页 面 表 3 种 数据 结构 来 实现 
虚拟 地 址 到 物理 地 址 的 变换 ,完成 内 存 的 分 配 和 回收 工作 。 

1) 页 表 

一 个 进程 往往 有 多 个 页 ,而 这 些 页 在 内 存 又 可 以 不 连续 存放 。 那 么 ,系统 如 何 知道 进程 
的 每 一 页 分 别 存放 在 内 存 的 哪 一 个 页 面 呢 ? 分 散 存 放 在 内 存 中 的 进程 又 是 如 何 正确 运行 的 
呢 ? 为 解决 上 述 问题 ,系统 将 进程 装 入 内 存 时 ,就 为 每 个 进程 建立 一 个 页 表 , 用 于 记录 一 个 
进程 在 内 存 中 的 分 配 情况 ,同时 还 可 利用 页 表 实 现 逻 辑 地 址 到 物理 
地 址 的 变换 。 

最 简单 的 页 表 由 页 号 与 页 面 号 ( 块 号 ) 组 成 ,如 图 5-11 所 示 。 页 表 [| 
在 系统 区 中 占有 一 块 固定 的 存储 区 。 页 表 的 大 小 由 进程 长 度 决定 。 例 
如 ,对 于 一 个 每 页 长 为 1KB、 大 小 为 20KB 的 进程 来 说 ,如 果 一 个 内 存 
单元 存放 一 个 页 表 项 , 则 只 要 分 配给 该 页 表 20 个 存储 单元 即 可 。 

2) 请 求 表 

为 了 确定 各 进程 的 页 表 在 内 存 中 的 实际 对 应 位 置 以 及 每 个 进程 所 要 求 的 页 面 数 ,系统 
建立 了 一 张 请 求 表 ,如 图 5-12 所 示 。 请 求 表 中 记录 了 每 个 进程 的 页 表 起 始 地 址 、 页 表 长 度 





页 号 页 面 号 

















图 5-11 页 表示 例 
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和 进程 所 要 求 的 页 面 数 ,状态 表示 对 应 的 进程 是 否 已 建立 了 相应 的 页 表 。 在 实际 系统 中 请 
求 表 由 所 有 进程 的 PCB 对 应 的 表 项 组 成 .也 就 是 说 ,每 个 进程 的 PCB 中 记录 着 其 相应 的 页 
表 的 起 始 地 址 和 长 度 。 




























进程 号 | 请 求 页 面 数 | 页 表 始 址 | 页 表 长 度 | ”状态 
1 20 1024 | 20 | 已 分 号 
2 34 1044 | 34 | 已 分 配 
3 18 1078 | “18 | 已 分 配 
4 | | 未 分 配 

















图 5-12 请求 表 示例 


3) 存储 页 面 表 

存储 页 面 表 是 整个 系统 一 张 , 该 表 指出 内 存 各 页 面 是 否 已 被 分 配 出 去 以 及 未 分 配 页 面 
的 总 数 。 

存储 页 面 表 也 有 两 种 构成 方法 ,一 种 是 在 内 存 中 划分 一 块 固定 区 域 ,每 个 存储 单元 的 每 
一 位 代表 一 个 页 面 ,如 果 该 页 面 已 被 分 配 , 则 对 应 的 位 置 1 ,否则 置 0。 这 种 方法 称 为 位 示 图 
法 。 图 5-13 给 出 了 位 示 图 的 示例 。 位 示 图 要 占据 一 部 分 内 存 。 例 如 ,一 个 划分 为 1024 个 
页 面 的 内 存 , 如 果 内 存单 元 长 20 位 , 则 位 示 图 要 占据 1024/20 王 52 个 存储 单元 。 











位 19 18 17 16 15 3 
"ola i lo 
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图 5-13 位 示 图 示例 


存储 页 面 表 的 另 一 种 构成 方法 是 采用 空闲 页 面 链 。 在 空闲 页 面 链 中 , 链 首页 面 的 第 一 
个 单元 和 第 二 个 单元 分 别 放 和 人 空闲 页 面 总 数 与 指向 第 一 个 空闲 页 面 的 指针 ,其 他 页 面 的 第 
一 个 单元 则 分 别 放 入 指向 下 一 个 空闲 页 面 的 指针 。 这 样 所 有 的 空闲 页 面 就 链 在 了 一 起 。 空 
闲 页 面 链 的 方法 由 于 使 用 了 空闲 页 面 本 身 的 单元 存放 指针 ,因此 不 占用 额外 的 内 存 空间 。 


3. 分 配 与 回收 算法 


利用 上 述 3 种 数据 结构 ,页 式 存 储 管理 的 分 配 算法 实现 起 来 相对 简单 。 分 配 程 序 按 请 
求 表 给 出 进程 所 要 求 的 页 面 数 ,检查 存储 页 面 表 中 是 否 有 足够 的 空闲 页 面 。 如 果 没 有 , 则 本 
次 分 配 无 法 实现 ; 如 果 有 , 则 首先 建立 页 表 , 然 后 搜索 出 满足 要 求 的 空闲 页 面 ,并 将 对 应 的 
页 面 号 填 入 页 表 中 。 图 5-14 给 出 了 上 述 页 面 分 配 算法 的 流程 图 。 

静态 页 式 存储 管理 的 页 面 回收 方法 较为 简单 , 当 进 程 执行 完成 时 ,撤销 对 应 的 页 表 , 并 
把 页 表 中 的 各 页 面 插入 存储 页 面 表 的 空闲 页 面 链 中 。 


请 求 n 个 页 面 | 

















存储 页 面 表 中 有 
7 个 空闲 页 面 吗 ? 







无 法 分 配 ) 





设置 页 表 ， 将 页 表 始 址 和 
页 表 长 度 置 入 请 求 表 中 ， 
置 状态 为 已 分 配 
1 
搜索 存储 页 面 表 ， 分 配 
7 个 页 面 ， 并 将 页 面 号 
填 入 页 表 中 


图 5-14 页 面 分 配 算法 流程 

















4. 地 址 结构 及 地 址 变换 


静态 页 式 存储 管理 的 一 个 关键 问题 是 地 址 变换 , 即 怎样 利用 页 表 将 逻辑 地 址 转换 为 物 
理 地 址 的 问题 。 为 此 ,系统 中 必须 设置 地 址 变换 机 构 ( 硬 件 ) 来 完成 地 址 的 变换 。 

1) 地 址 结构 

在 学 习 利用 页 表 是 怎样 完成 地 址 变换 之 前 ,必须 了 解 地 址 结构 。 在 页 式 存储 管理 中 ,分 
页 系统 的 地 址 变换 机 构 自 动 把 逻辑 地 址 解释 为 两 部 分 : 高 位 部 分 为 页 号 ,低位 部 分 为 页 内 
地 址 。 因 此 ,逻辑 地 址 用 一 个 数 对 (,d) 来 表示 ,其 中 户 表示 逻辑 地 址 所 在 的 页 号 ,qd 表示 
页 内 地 址 。p、d 所 占 的 位 数 取决 于 页 的 大 小 和 有 效 地 址 长 度 。 为 了 简化 地 址 变换 过 程 和 分 
页 ,通常 页 的 大 小 为 2 的 次 寡 。 如 取 页 大 小 为 1024B 二 2*B 二 1KB 或 4096B 一 22B 一 4KB 
等 。 若 页 的 大 小 为 2 , 则 d 所 占 的 位 数 为 n,p 所 占 的 位 数 为 有 效 地 址 长 度 一 x。 对 于 某 特 
定 的 计算 机 ,其 地 址 结构 是 一 定 的 。 

例如 ,假设 计算 机 CPU 有 效 地 址 为 16 位 , 且 页 大 小 工 =1KB。 在 地 址 变换 时 ,分 页 系 
统 的 地 址 变换 机 构 自 动 把 逻辑 地 址 解释 为 两 部 分 : 页 号 p(6 位 ) 和 页 内 地 址 4(10 位 ), 如 
图 5-15 所 示 。 





页 号 p 页 内 地 址 d 














图 5-15 地址 结构 示例 


车 给 定 逻 辑 地 址 为 A ,页面 的 大 小 为 工 (单位 为 字 节 ), 则 页 号 p 和 页 内 地 址 d 可 按 下 式 
求 得 : 
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三 A 
pINT( 允 ) 
d=AMODL 


其 中 ,INT 是 取 整 函数 ,MOD 是 取 余 函 数 。 例 如 ,假设 页 大 小 工 王 2KB 王 2048B,A 一 
4200, 则 按 上 式 得 : 如 一 2,d 一 104。 

2) 地 址 变换 

页 表 的 功能 可 以 由 一 组 专门 的 寄存 器 来 实现 ,一 个 页 表 项 用 一 个 寄存 器 。 由 于 寄存 器 
有 具有 较 高 的 访问 速度 ,因而 有 利于 提高 地 址 变换 的 速度 。 但 由 于 寄存 器 成 本 较 高 , 且 大 多 数 
现代 计算 机 系统 的 内 存 较 大 ,使 页 表 项 的 总 数 可 达 几 千 甚 至 几 十 万 个 ,显然 这 些 页 表 不 可 能 
都 用 寄存 器 来 实现 。 因 此 ,页 表 大 都 是 驻 留 在 系统 区 内 的 一 个 数据 结构 ,而 在 系统 中 只 设置 
一 个 页 表 控 制 寄 存 器 ,在 其 中 存放 当前 运行 的 进程 的 页 表 始 址 和 页 表 长 度 。 当 进程 未 执行 
时 ,页 表 的 始 址 和 长 度 存放 在 本 进程 的 PCB 中 ; 当 进 程 被 调度 执行 时 , 才 将 这 两 个 数据 装 
人 页 表 控 制 寄存 器 中 。 在 单 处 理 机 环境 下 ,虽然 系统 中 可 以 运行 多 个 进程 ,但 只 需 一 个 页 表 
控制 寄存 器 (因为 任何 时 刻 只 能 运行 一 个 进程 ) 。 下 面 通过 例子 来 说 明 页 式 存储 管理 的 地 址 
变换 过 程 。 

例 5-1 假设 系统 的 页 面 长 度 为 1KB。 当前 正在 执行 的 进程 对 应 页 
的 页 表 如 图 5-16 所 示 。 当 前 进程 中 有 一 条 指令 “LOAD 1,2500”, 如何 0 2 
利用 页 表 进行 地 址 变换 才能 正确 地 执行 这 条 指令 呢 ? 1 

解 : 当 CPU 执行 指令 “LOAD 1,2500” 时 ,CPU 要 从 相对 地 址 上 2 
2500 中 将 数据 取出 , 放 入 1 号 寄存 器 中 。 将 相对 地 址 2500 映射 为 对 应 。 图 5-16 页 表 
的 物理 地 址 的 变换 过 程 如 图 5-17 所 示 。 

控制 寄存 器 有 效 地 址 
页 表 长 度 | 页 表 始 址 2 | 452 
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图 5-17 页 式 存储 管理 的 地 址 变换 过 程 


为 了 找 出 2500 对 应 的 物理 地 址 ,分 页 系统 地 址 变换 机 构 首 先 将 逻辑 地 址 2500 转换 为 
两 部 分 : p 二 2,d 二 452。 然 后 ,以 页 号 为 案 引 检索 页 表 。 在 执行 检索 前 , 先 将 页 号 与 页 表 长 
度 进行 比较 。 如 果 页 号 大 于 或 等 于 页 表 长 度 , 则 表示 本 次 所 访问 的 地 址 已 超越 进程 的 地 址 
空间 ,将 发 生地 址 越界 中 断 ; 否则 ,将 页 表 始 址 (在 页 表 控 制 寄存 器 中 ) 与 页 号 (2) 和 页 表 项 
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长 度 的 乘积 相 加 , 便 得 到 该 表 项 在 页 表 中 的 位 置 , 于 是 可 从 中 得 到 进程 的 2 号 页 存放 在 页 面 
号 为 8 的 内 存 中 ,将 找到 的 页 面 号 (8) 装 和 人 物理 地 址 寄存 器 中 。 与 此 同时 ,再 将 有 效 地 址 寄 
存 器 中 的 页 内 地 址 (452) 送 入 物理 地 址 寄存 器 的 块 内 地 址 字段 中 。 由 此 ,页 面 号 (8) 与 页 内 
相对 地 址 (452) 相 连 ,得 到 相对 地 址 2500 对 应 的 物理 地 址 为 8X1024 十 452 二 8644。 
由 于 静态 页 式 存储 管理 要 求 进程 在 分 配 到 其 申请 的 全 部 页 面 后 才 可 装 入 内 存 得 到 执 
行 , 这 使 得 进程 的 大 小 受到 可 用 页 面 数 的 限制 。 而 事实 上 ,在 一 段 时 间 内 ,CPU 总 是 集中 地 
访问 程序 中 的 某 一 部 分 。 例 如 ,含有 局 部 变量 、 常 用 函数 、 循 环 语句 的 程序 段 往 往 是 经 常 被 
访问 的 部 分 ,人 们 把 这 种 现象 称 为 局 部 性 原理 。 这 就 使 得 系统 为 用 户 进 程 分 配 一 定数 量 的 
内 存 页 面 就 可 使 程序 能 正确 地 运行 ,为 用 户 提供 一 hc 由 
此 ,在 静态 页 式 存储 管理 的 基础 上 产生 了 动态 页 式 存储 管 


5.3.2 动态 页 式 存储 管理 
1. 基本 思想 


动态 页 式 存储 管理 的 基本 思想 是 , 当 一 个 进程 要 求 运行 时 ,不 是 把 整个 进程 的 程序 代码 
和 数据 全 部 装 和 内存, 只 需 将 当前 要 运行 的 那 部 分 程序 代码 和 数据 所 对 应 的 页 装 和 人 内存 , 便 
可 启动 运行 。 以 后 在 进程 运行 的 过 程 中 , 当 需 要 访问 某 些 页 时 ,由 系统 自动 地 将 需要 的 页 从 
外 存 调 入 内 存 。 如 果 内 存 没 有 足够 的 空 亲 页面, 将 暂 不 运行 的 进程 页 调 出 内 存 ,以 便装 入 新 
的 进程 页 。 

动态 页 式 存 储 管理 使 得 用 户 的 程序 空间 不 再 受 内 存 空 间 大 小 的 限制 。 即 ,系统 从 人 好 辑 
上 可 以 为 用 户 提供 一 个 比 实际 内 存 更 大 的 虚拟 存储 空间 ,从 而 实现 了 内 存 的 迎 辑 扩充 技术 。 
为 了 区 别 内 外 存 中 的 不 同 的 页 ,通常 把 一 个 进程 经 分 配 调 和 内存 中 的 页 称 为 实 页 ,把 外 存 中 
Se 

态 页 式 存 储 管理 中 的 程序 地 址 的 分 页 和 地 址 变换 与 静态 页 式 存储 管理 完全 相 

同 。 os 由 于 动态 页 式 存储 管理 只 i 了 的 进程 分 配 必 要 的 内 存 空间 ,因此 ,必然 会 产生 
两 个 问题 : 

(1) 当 进程 要 访问 的 某 个 虚 页 不 在 内 存 中 时 ,怎样 发 现 这 种 缺 页 情况 ,发 现 后 又 怎 
么 办 ? 

(2) 当 需 要 把 某 一 虚 页 调和 人 内 存 时 , 若 此 时 内 存 中 没有 空闲 页 面 ,应 该 怎么 处 理 ? 

以 下 将 介绍 动态 页 式 存 储 管理 方案 中 解决 这 两 个 问题 的 主要 技术 原理 。 


2. 页 表 


为 了 知道 哪些 页 已 经 调 入 内存 .哪些 页 还 没有 调 入 内 存 , 以 及 对 页 的 换 进 和 换 出 进行 控 
制 , 需 扩充 页 表 。 扩 充 后 的 页 表 字 段 如 下 : 





页 号 页 面 号 | 驻 留 位 | 访问 位 | 修改 位 | 外 存 地 址 


























各 字段 的 说 明 如 下 : 
(1) 驻 留 位 : 用 于 指示 该 页 是 否 在 内 存 中 。 
(2) 访问 位 : 用 于 记录 该 页 在 一 段 时 间 内 被 访问 的 次 数 ,或 记录 本 页 最 近 有 多 长 时 间 
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未 被 访问 , 供 页 换 出 时 参考 。 

(3) 修改 位 : 表示 该 页 在 调 人 内 存 后 是 否 被 修改 过 。 由 于 内 存 中 每 一 页 在 外 存 中 都 保 
留 了 一 份 副本 ,因此 , 若 该 页 在 内 存 中 存放 时 未 被 修改 过 , 则 在 置换 该 页 时 就 不 需要 将 该 页 
写 回 到 外 存 上 ,以 减少 系统 启动 外 存 的 次 数 ; 若 已 被 修改 过 , 则 必须 将 该 页 写 回 到 外 存 上 ， 
以 保证 外 存 中 所 保留 的 始终 是 最 新 的 副本 。 

(4) 外 存 地 址 : 用 于 指出 该 页 在 外 存 中 的 地 址 ,以 便 系统 从 外 存 中 调 人 该 页 。 


3. 缺 页 中 断 机 构 


当 CPU 需 访问 的 页 不 在 内 存 中 时 ,将 发 生 缺 页 中 断 ,这 一 过 程 由 专门 的 硬件 机 构 实 
现 。 如 图 5-18 所 示 , 当 发 生 了 缺 页 中 断后 ,CPU 将 转 去 执行 相应 的 缺 页 中 断 处 理 过 程 。 
图 5-18 中 的 虚线 下 面 给 出 了 缺 页 中 断 的 处 理 过 程 。 当 内 存 中 没有 空闲 页 面 时 ,系统 将 按照 
一 定 的 淘汰 算法 (有 关 的 淘汰 算法 将 在 5. 4 节 介 绍 ) ,在 内 存 中 选择 一 页 淘汰 ,将 需要 的 虚 页 
调和 人 内 存 。 








































































调度 该 进程 执行 
4 
和 
一 一 | 一 一 | 启动 待 执行 指令 执行 下 一 条 指令 
下 
1 
i 计算 页 号 与 页 内 访问 内 存 执行 完 
件 | 地 址 该 指令 
完 ! 下 
成 | 
1 该 页 在 内 存 中 吗 ? 地 址 变换 
选择 一 页 淘汰 























调整 页 表 及 存储 
页 面 表 把 该 页 写 回 外 存 
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恢复 被 中 断 进程 现场 
[| 
图 5-18 缺 页 中 断 的 处 理 过 程 

















5.3.3 指令 存 取 速度 与 页 面 大 小 问题 
1. 快 表 


页 式 存储 管理 系统 中 , 存 取 一 个 数据 或 执行 一 条 指令 要 访问 两 次 主 存 : 一 次 是 访问 页 
表 , 另 一 次 是 访问 真正 的 内 存 地 址 。 显 然 , 这 种 方法 比 通常 执行 指令 的 速度 慢 了 一 倍 。 为 了 
加 快 指 令 的 存 取 速 度 ,可 在 地 址 变换 机 构 中 增设 一 个 具有 并 行 查 找 能 力 的 特殊 的 公共 高 速 
缓冲 寄存 器 ,又 称 联想 寄存 器 (associative memory) 或 快 表 。 联 想 寄 存 器 由 一 组 可 以 与 内 存 
并 行 访问 的 寄存 器 (通常 为 16 一 512 个 ) 组 成 ,用 于 存放 当前 进程 经 常 要 访问 的 那些 页 的 页 
表 项 。 此 时 的 地 址 变换 过 程 是 : 在 CPU 给 出 有 效 地 址 后 ,由 地 址 变换 机 构 自 动 将 页 号 p 与 
快 表 中 的 所 有 页 号 进行 比较 ,车 其 中 有 与 此 匹配 的 页 号 , 便 可 直接 从 快 表 中 读 出 与 该 页 相对 
应 的 物理 块 号 ,进行 地 址 变换 ; 否则 访问 内 存 中 的 页 表 , 找 到 该 页 对 应 的 物理 块 号 ,进行 地 
址 变换 ,同时 将 该 页 对 应 的 表 项 存 人 快 表 的 一 个 寄存 器 单元 中 。 在 快 表 中 搬入 一 个 页 表 项 
时 ,如 果 寄 存 器 已 满 , 则 要 进行 快 表 的 置换 , 即 ,在 快 表 中 选择 一 个 访问 位 值 最 小 的 表 目 ,将 
之 淘汰 ,以 便 插 入 新 的 页 表 项 。 所 谓 访 问 位 值 最 小 ,可 认为 是 该 页 在 过 去 一 段 时 间 内 被 
访问 的 次 数 最 少 。 为 此 ,每 访问 一 次 该 页 ,就 要 对 该 页 的 访问 位 值 进行 计数 , 即 访问 位 值 
反映 了 该 页 被 访问 的 频 度 ; 或 者 是 让 该 页 最 先进 入 快 表 , 即 访问 位 值 反 映 了 该 页 进入 快 
表 的 次 序 。 

事实 上 ,查找 页 表 和 查找 快 表 的 两 项 工作 在 硬件 上 是 同时 进行 的 ,一 旦 发 现 该 页 在 快 表 
中 ,就 立即 停止 查找 内 存 页 表 。 程 序 和 数据 的 访问 往往 带 有 局 部 性 , 据 统计 ,从 快 表 中 能 找 
到 所 需 页 表 项 的 概率 可 达 90% 以 上 ,而 由 于 访问 快 表 的 速度 要 比 访问 页 表 的 速度 高 一 个 数 
量 级 ,从 而 利用 快 表 大 大 提高 了 页 式 存储 管理 地 址 变换 的 速度 。 图 5-19 描述 了 具有 快 表 的 
地 址 变换 过 程 。 

页 表 寄 存 器 逻辑 地 址 L 
页 表 始 址 页 表 长 度 上 一 Ge) 一 一 越界 中 断 页 号 | 页 内 地 址 
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5-19 具有 快 表 的 地 址 变换 过 程 


2. 页 面 大 小 
由 于 进程 的 地 址 空间 被 连续 地 划分 成 若干 页 ,系统 以 页 为 单位 分 配 内 存 , 块 与 页 等 长 。 
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因此 ,除了 一 个 进程 中 的 最 后 一 页 可 能 不 足 一 个 页 的 大 小 ,而 产生 页 内 碎片 外 ,内 存 中 不 会 
存在 不 可 利用 的 空闲 页 面 。 因 此 ,静态 页 式 存储 管理 解决 了 分 区 式 存 储 管理 的 碎片 问题 。 
但 是 页 面 的 大 小 选择 也 要 恰当 。 

选择 最 优 的 页 面 大 小 需要 在 几 个 相互 冲突 的 因素 之 间 折 中 。 如 果 页 面 太 大 ,页 式 存储 
管理 就 退化 为 分 区 式 存储 管理 ,同时 导致 页 内 碎片 过 大 ; 而 如 果 页 面 太 小 ,页 表 将 占用 内 存 
空间 太 多 。 一 个 系统 的 页 表 占 用 内 存 的 空间 大 小 与 虚 存 大 小 和 页 大 小 有 关 。 而 现代 计算 机 
系统 都 支持 大 的 逻辑 地 址 空间 (2 一 2#% ) ,这 样 页 表 就 非常 大 。 例 如 ,一 个 进程 的 虚 存 大 小 
为 11MB, 页 大 小 为 2KB, 则 该 进程 的 页 数 为 16X1024/2 王 8192 个 。 若 一 个 页 表 的 表 目 占 2 
个 字 节 ,那么 页 表 占 用 内 存 的 空间 大 小 为 8192X2B 二 16KB。 在 动态 页 式 存储 管理 中 ,如 果 
页 面 太 小 ,还 要 增加 内 外 存 交换 次 数 。 因 此 ,在 实际 使 用 中 考虑 众多 因素 ,大 部 分 的 计算 机 
使 用 的 页 面 大 小 为 512B 一 64KB。 


5.3.4 存储 保护 


页 式 存 储 管理 的 页 面 保护 可 采用 界限 寄存 器 法 或 保护 键 法 。 界 限 寄存 器 法 通过 地 址 变 
换 机 构 中 的 页 表 寄 存 器 中 的 页 表 长 度 和 所 要 访问 的 逻辑 地 址 相 比 较 来 完成 , 见 图 5-19。 保 
护 键 法 的 实现 则 是 在 页 表 中 增加 相应 的 保护 位 即 可 。 


5.3.5 页 式 存储 管理 的 优 缺 点 
1. 优点 


页 式 存 储 管 理 有 以 下 优点 : 

(1) 由 于 页 式 存储 管理 不 要 求 作 业 或 进程 的 程序 段 和 数据 在 内 存 中 连续 存放 ,从 而 有 
效 地 解决 了 内 存 的 碎片 问题 ,因此 ,可 使 内 存 得 到 有 效 的 利用 ,有 可 能 使 更 多 的 进程 同时 投 
入 运行 ,可 进一步 提高 处 理 机 的 利用 率 。 

(2) 动态 页 式 存 储 管理 只 要 求 每 个 进程 部 分 装 入 便 可 运行 ,实现 了 内 存 的 扩充 技术 。 
可 为 用 户 提供 比 实 际 内 存 更 大 的 虚拟 存储 空间 ,使 用 户 可 利用 的 存储 空间 大 大 增加 ,有 利于 
多 道 程序 的 组 织 ,可 以 提高 内 存 的 利用 率 。 


2. 缺点 


页 式 存储 管理 有 以 下 缺点 : 

(1) 要 求 有 相应 的 硬件 支持 ,例如 地 址 变换 机 构 、 缺 页 中 断 机构 和 页 面 淘汰 机 构 等 。 这 
些 增加 了 计算 机 的 成 本 。 

(2) 增加 了 系统 开销 。 例 如 ,页 面 中 断 处 理 ,表格 的 建立 和 管理 ,这 些 都 需 花 费 处 理 机 
时 间 , 且 表格 还 要 占用 一 定 的 存储 空间 。 

(3) 淘汰 算法 选择 不 当 有 可 能 会 严重 影响 系统 的 使 用 效率 。 

(4) 虽然 消除 了 碎片 ,但 同时 还 存在 页 内 碎片 问题 。 


64 淘汰 算法 与 抖动 现象 


动态 页 式 存储 管理 虽然 能 有 效 地 提高 主 存 的 利用 率 ,实现 了 内 存 的 扩充 技术 ,但 同时 也 
带 来 了 一 些 新 的 问题 。 例 如 ,为 使 一 个 进程 能 正确 地 运行 应 为 它 分 配 多 少 个 内 存 页 面 , 当 访 
问 的 页 不 在 内 存 时 采用 什么 样 的 淘汰 算法 ,等 等 。 下 面 讨论 这 些 问 题 。 


5.4.1 淘汰 算法 


进程 在 运行 过 程 中 , 若 所 访问 的 页 不 在 内 存 时 ,必须 把 它们 调和 人 内存, 但 当 内 存 空闲 页 
面 不 足 时 ,必须 从 内 存 中 调 出 一 页 或 多 页 , 送 到 磁盘 的 交换 区 中 ,以 便 把 需要 的 页 调 入 内 存 。 
然而 应 该 将 内 存 中 的 哪些 页 调 出 内 存 , 须 根据 一 定 的 算法 来 确定 。 通 常 把 选择 要 换 出 页 的 
算法 称 为 淘汰 算法 。 而 一 个 好 的 淘汰 算法 应 使 缺 页 率 尽 可 能 小 。 

在 进行 页 面 置换 时 ,可 采用 全 局 或 局 部 置换 。 局 部 置换 指 进程 发 生 缺 页 时 ,只 能 从 分 配 
给 该 进程 的 内 存 页 面 中 选择 一 页 换 出 。 全 局 置换 是 指 进程 发 生 缺 页 时 ,选择 淘汰 的 页 可 能 
是 内 存 中 任 一 进程 的 页 。 

下 面 介绍 几 种 常用 的 淘汰 算法 。 为 简化 算法 ,这 些 算法 均 采用 局 部 置换 。 


1. 最 佳 淘汰 算法 


最 佳 (Optimal) 淘 汰 算法 是 一 种 理想 的 淘汰 算法 , 它 选 择 将 来 不 再 使 用 或 者 在 最 远 的 将 
来 才 可 能 被 使 用 的 页 淘汰 。 显 然 采 用 最 佳 淘汰 算法 可 以 保证 得 到 最 低 的 缺 页 率 。 但 是 实际 
上 , 当 发 生 缺 页 时 ,操作 系统 根本 没有 办 法 知道 每 一 个 页 将 在 什么 时 候 被 访问 ,所 以 ,最 佳 淘 
汰 算法 是 不 能 实现 的 。 尽 管 如 此 ,该 算法 仍然 有 意义 , 它 可 作为 衡量 其 他 算法 优 劣 的 一 个 
标准 。 

为 了 比较 各 种 算法 的 优 劣 ,下 面 通过 一 个 例子 来 说 明 。 

例 5-2 假设 一 个 进程 p 有 6 页 ,该 进程 执行 过 程 中 ,访问 页 号 的 顺序 是 0,2,5,3,2,4， 
2,0,3,2,1,3,2,3,4,3。 如 果 给 进程 p 分 配 3 个 内 存 页 面 ,那么 ,采用 最 佳 淘汰 算法 时 ,执行 
进程 p 将 会 发 生 多 少 次 缺 页 中 断 ? 缺 页 率 是 多 少 ? 

解 : 采用 最 佳 淘汰 算法 时 ,进程 p 的 各 页 在 内 存 中 的 变换 如 图 5-20 所 示 。 
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图 5-20 最 佳 淘汰 算法 的 置换 图 
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从 图 5-20 中 可 以 看 出 ,进程 p 在 执行 过 程 中 发 生 了 8 次 缺 页 (5 次 置换 ), 缺 页 率 是 
8/16 王 50%% 。 


2. 先进 先 出 淘汰 算法 


先进 先 出 (FIFO) 淘 汰 算法 认为 最 先 调 入 内 存 的 页 不 再 被 访问 的 可 能 性 要 比 其 他 页 大 ， 
因而 选择 最 先 调 入 内 存 的 页 换 出 。 实 现 FIFO 算法 比较 简单 ,只 需 把 各 个 已 分 配 的 页 按 分 
配 时 间 顺 序 链 接 起 来 ,组 成 FIFO 队列 ,并 设置 一 个 指针 , 称 为 置换 指针 ,使 它 指 向 FIFO 队 
列队 首页 面 。 在 选择 一 页 淘汰 时 ,总 是 淘汰 置换 指针 指向 的 页 ,而 把 换 进 的 页 链接 人 FIFO 
队 尾 。 

例 5-3 对 于 例 5-2, 如 果 采 用 FIFO 淘汰 算法 ,执行 进程 p 将 会 发 生 多 少 次 缺 页 中 断 ? 
缺 页 率 是 多 少 ? 

解 : 采用 FIFO 淘汰 算法 时 ,进程 p 的 各 页 在 内 存 中 的 变换 如 图 5-21 所 示 。 
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图 5-21 先进 先 出 算法 的 置换 图 (1) 


从 图 5-21 中 可 以 看 出 ,进程 p 在 执行 过 程 中 发 生 了 12 次 缺 页 , 比 最 佳 算法 多 了 4 次 ， 
缺 页 率 是 12/16 二 75%。 

FIFO 算法 容易 实现 ,但 是 它 所 依据 的 假设 与 普遍 的 进程 运行 规律 不 符 。 它 只 适用 于 
CPU 按 线性 顺序 访问 地 址 空间 的 进程 。 而 实际 上 ,由 局 部 性 原理 知 , 大 部 分 的 时 候 ,CPU 
不 是 按 线性 顺序 访问 地 址 空间 的 。 例 如 ,含有 局 部 变量 常用 函数 、 循 环 语句 的 页 ,虽然 在 内 
存 中 驻 留 了 很 久 ,但 是 它们 往往 是 经 常 被 访问 的 页 。 而 FIFO 算法 可 能 使 这 些 页 刚刚 被 淘 
汰 出 去 而 又 要 立即 被 调 回 内 存 , 从 而 使 缺 页 率 变 大 。 

FIFO 算法 的 另 一 个 缺点 是 它 有 一 种 陷阱 现象 。 一 般 来 说 ,对 于 任 一 作业 或 进程 ,如 果 
给 它 分 配 的 内 存 页 面 数 越 接 近 它 所 要 求 的 页 面 数 , 则 发 生 缺 页 的 次 数 会 越 少 。 在 极限 情况 
下 ,这 个 推论 是 成 立 的 。 因 为 如 果 给 一 个 进程 分 配 了 它 所 要 求 的 全 部 页 面 , 则 不 会 发 生 缺 页 
现象 。 但 是 ,使 用 FIFO 算法 时 ,在 未 给 进程 或 作业 分 配 足 它 所 要 求 的 页 面 数 时 ,有 时 会 出 现 
分 配 的 页 面 数 增多 时 , 缺 页 的 次 数 反而 会 增加 的 陷阱 现象 。 这 种 现象 被 称 为 Belady 现象 。 

下 面 通过 例子 来 说 明 Belady 现象 。 

例 5-4 假设 一 个 进程 p, 有 5 页 ,该 进程 执行 过 程 中 访问 页 号 的 顺序 是 1,2,3,4,1,2， 
5,1,2,3,4,5。 如 果 给 进程 p 分配 3 个 内 存 页 面 : 采 用 FIFO 淘汰 算法 时 ,进程 pi 在 内 存 
中 的 各 页 变换 如 图 5-22 所 示 。 

由 图 5-22 中 可 以 看 出 ,进程 户 在 执行 过 程 中 发 生 了 9 次 缺 页 , 缺 页 率 是 9/12 二 75%。 

但 是 ,如 果 为 进程 p; 分 配 4 个 内 存 页 面 , 则 进程 p, 在 内 存 中 的 各 页 变换 如 图 5-23 
所 示 。 
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图 5-22 ”先进 先 出 算法 的 置换 图 (2) 
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图 5-23 先进 先 出 算法 的 置换 图 (3) 


由 图 5-23 中 可 以 看 出 ,进程 p 在 执行 过 程 中 发 生 了 10 次 缺 页 ,比分 配 3 个 页 面 时 反 
而 多 了 1 次 , 缺 页 率 是 10/12 二 83%。 
FIFO 算法 产生 Belady 现象 的 原因 在 于 它 根本 没有 考虑 进程 执行 的 动态 特征 。 


3. 最 近 最 少 使 用 淘汰 算法 


由 于 无 法 预知 各 个 页 面 将 来 的 访问 情况 ,只 能 利用 “最 近 的 过 去 ”作为 “最 远 的 将 来 ”的 
近似 。 最 近 最 少 使 用 (Least Recently Used,LRU) 淘 汰 算法 的 出 发 点 是 ,如 果 某 页 很 长 时 间 
未 被 访问 , 则 它 在 最 近 一 段 时 间 内 也 不 会 被 访问 。 因 此 ,LRU 淘汰 算法 每 次 选择 最 近 最 久 
未 被 访问 的 页 淘汰 。 

例 5-5 对 于 例 5-2 中 给 出 的 进程 ,采用 LRU 淘汰 算法 时 ,各 页 在 内 存 中 的 变换 如 图 5-24 
所 示 。 
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图 5-24 LRU 淘汰 算法 的 置换 图 


由 图 5-24 中 可 以 看 出 ,进程 p 在 执行 过 程 中 ,发 生 了 9 次 缺 页 , 比 最 佳 淘汰 算法 多 1 
次 , 比 FIFO 算法 少 3 次 , 缺 页 率 是 9/16 二 56%。 
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LRU 虽然 是 一 种 较 好 的 淘汰 算法 ,但 是 完全 实现 LRU 淘汰 算法 的 代价 比较 大 。 为 了 
实现 LRU 淘汰 算法 ,需要 一 个 存放 内 存 中 所 有 页 的 链表 ,最 近 使 用 的 页 在 表 头 ,最 久未 使 
用 的 页 在 表 尾 。 或 给 每 一 个 页 一 个 计数 器 上 ,用 来 记录 一 个 页 上 次 被 访问 以 来 所 经 历 的 时 
间 。 当 须 淘汰 一 页 时 ,选择 : 值 最 大 的 淘汰 。 由 于 存储 器 有 较 高 的 访问 速度 ,在 lms 内 可 能 
对 某 页 连续 访问 成 千 上 万 次 ,因而 ,这 一 计数 器 需要 足够 大 ,并 且 有 较 快 的 访问 速度 。 由 此 
可 见 ,为 了 实现 LRU 淘汰 算法 ,需要 一 些 特殊 的 硬件 支持 。 下 面 是 3 种 可 行 的 方法 。 

1) 计数 器 法 

这 种 方法 要 求 系统 中 有 一 个 64 位 的 硬件 计数 器 C, 它 在 每 次 执行 完 指 令 后 自动 加 1。 
而 进程 的 每 个 页 表 项 必须 有 一 个 足以 容纳 这 个 计数 器 的 值 的 域 。 在 每 次 访问 内 存 后 ,当前 
的 C 值 存放 到 被 访问 的 页 的 页 表 项 中 。 当 发 生 缺 页 时 ,操作 系统 检查 页 表 中 所 有 计数 器 的 
值 , 其 中 C 值 最 小 的 对 应 页 就 是 最 近 最 少 使 用 的 页 。 显 然 这 种 方法 除了 硬件 技术 的 支持 ， 
处 理 机 还 要 花费 时 间 去 读 写 计 数 器 的 值 ,而 且 额 外 增加 了 页 表 的 长 度 , 将 占用 更 多 的 内 存 
空间 。 

2) 栈 法 

这 种 方法 可 利用 一 个 特殊 的 栈 来 保存 当前 使 用 的 各 个 页 号 。 每 当 进程 访问 某 页 时 , 便 
将 该 页 的 页 号 从 栈 中 移出 ,将 它 压 人 栈 项 。 因 此 , 栈 顶 始终 是 最 近 新 被 访问 的 页 号 ,而 栈 底 
则 是 最 近 最 久未 使 用 的 页 。 对 于 例 5-2 中 的 引用 序列 ,其 访问 过 程 如 图 5-25 所 示 。 
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图 5-25 LRU 淘汰 算法 的 栈 实现 


3) 寄存 器 法 

为 了 记录 某 进 程 在 内 存 中 各 页 的 访问 情况 , 须 为 每 个 内 存 页 面 配置 一 个 位 的 移 位 寄 
存 器 ,可 表示 为 玉 = Ri， R,-。…R。 Ri Ro。。 当 某 一 内 存 页 面 被 访问 时 ,将 其 对 应 的 寄存 器 的 
最 高 位 R,-1 管 为 1, 每 隔 一 定时 间 将 寄存 器 R 中 的 值 右 移 一 位 。 这 样 , 当 需 要 淘汰 一 页 时 ， 
R 中 值 最 小 的 一 页 就 是 最 近 最 久未 访问 的 页 。 例 如 ,在 图 5-26 中 , 某 进 程 在 内 存 中 占用 了 6 
个 内 存 页 面 , 每 一 页 对 应 的 寄存 器 及 的 R; 一 Ru 位 的 值 表示 一 段 时 间 间 隔 内 该 页 被 访问 的 
情况 。 这 里 ,第 6 页 的 值 最 小 ,因此 ,第 6 页 是 最 近 最 久未 被 访问 的 页 , 当 发 生 缺 页 时 ,首先 
将 它 换 出 。 
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5-26 LRU 淘汰 算法 的 寄存 器 实现 


4. LRU 的 近似 算法 


因为 ,LRU 算法 的 实现 需要 的 硬件 太 多 .因此 ,在 实际 系统 中 ,往往 使 用 LRU 的 近似 
算法 ,比较 常用 的 近似 算法 有 以 下 两 种 。 

(1) 最 近 未 使 用 (Not Recently Used,NUR) 算 法 。 该 算法 从 最 近 一 段 时 间 内 未 被 使 用 
的 页 中 任 选 一 页 淘汰 。 该 算法 认为 ,淘汰 一 个 在 最 近 一 段 时 间 内 没有 被 访问 的 已 被 修改 过 
的 页 要 比 淘汰 一 个 被 频繁 访问 的 没有 被 修改 过 的 页 要 好 。 实 现 该 算法 需 在 页 表 中 增设 两 个 
状态 位 : 访问 位 R 与 修改 位 M。R 表示 对 应 的 页 在 最 近 一 段 时 间 内 是 否 被 访问 过 ,M 表示 
对 应 的 页 是 否 被 修改 过 。 一 个 进程 启动 时 ,所 有 的 页 对 应 的 M 与 R 都 由 系统 设置 为 0。 当 
某 页 被 访问 时 , 置 其 访问 位 R 为 1; 如 果 该 页 被 修改 过 , 则 置 其 修改 位 M 为 1。 系统 周期 性 
地 (比如 在 每 次 时 钟 中 断 时 ) 对 所 有 访问 位 清 零 ,以 便 把 最 近 未 被 访问 和 被 访问 的 页 区 别 开 
来 。 这 样 , 内 存 中 可 能 有 4 种 类 型 的 页 面 : 

。 尺 二 0,M 二 0, 没 有 被 访问 过 ,没有 被 修改 过 ,是 最 佳 的 淘汰 页 。 

。 民 二 0,M 二 1, 没 有 被 访问 过 ,被 修改 过 。 

。 尺 = 二 1,M= 二 0, 被 访问 过 ,没有 被 修改 过 ，。 

。 尺 二 1,M 二 1, 被 访问 过 ,被 修改 过 。 

当 发 生 缺 页 时 ,依次 从 编号 最 小 的 非 空 类 中 随机 选择 一 页 淘汰 。NUR 算法 的 优点 是 
易于 实现 和 高 效 性 。 虽 然 它 的 性 能 不 是 最 好 的 ,但 在 实际 中 常常 是 够 用 的 。 

(2) 最 不 经 常 使 用 (Not Frequently Used'NFU) 算 法 。 该 算法 选择 到 当前 时 间 为 止 被 
访问 次 数 最 少 的 那 一 页 淘汰 。 这 只 需 在 页 表 中 给 每 一 页 增设 一 个 访问 计数 器 即 可 实现 。 每 
当 该 页 被 访问 时 ,访问 计数 器 加 1。 而 发 生 缺 页 时 , 则 淘汰 计数 器 值 最 小 的 那 一 页 ,并 将 所 
有 的 计数 器 清 零 。 

NFU 算法 的 问题 是 ,如 果 有 两 个 页 的 计数 器 都 是 0, 只 能 随机 选择 一 页 淘汰 ,而 在 实际 
中 ,有 可 能 一 个 页 上 次 被 访问 是 在 9 个 周期 以 前 , 另 一 个 页 在 1000 个 周期 以 前 ,而 在 NFU 
算法 中 却 不 能 反映 这 个 差别 ,结果 是 淘汰 出 去 的 可 能 是 有 用 的 页 而 不 是 不 再 使 用 的 页 。 


5.4.2 抖动 现象 与 工作 集 


在 动态 页 式 存储 管理 中 ,有 可 能 出 现 这 样 的 现象 : 对 于 刚刚 被 淘汰 出 去 的 页 ,进程 可 能 
马上 又 要 访问 它 , 故 又 需 将 它 调和 人 内 存 , 因 无 空闲 内 存 页 面 而 又 要 淘汰 另 一 页 ,而 后 者 很 可 
能 是 即将 被 访问 的 页 。 于 是 造成 系统 需要 花费 大 量 的 时 间 忙 于 进行 这 种 频繁 的 页 面 调换 ， 
从 而 无 法 完成 用 户 所 要 求 的 工作 ,这 称 为 抖动 现象 。 那 么 ,抖动 现象 的 发 生 与 什么 有 关 ? 如 
何 才能 防止 抖动 现象 的 发 生 呢 ? 

实验 表明 ,抖动 与 内 存 中 并 发 的 进程 数 以 及 系统 分 配给 每 个 进程 的 实 页 数 有 关 。 

考察 单 CPU 的 多 道 程序 系统 ,CPU 的 利用 率 与 内 存 中 并 发 进程 数 的 关系 如 图 5-27 
所 示 。 

由 图 5-27 可 知 ,开始 时 ,CPU 的 利用 率 Us 随 着 并 发 进程 数 的 增加 而 增加 。 但 是 , 当 N 
达到 一 定 的 值 时 ,Us 将 达到 峰值 域 (图 中 A 一 C); 如 果 N 继续 增加 ,将 引起 系统 发 生 拌 动 而 
使 Up 急剧 下 降 , 即 系统 内 的 并 发 进程 数 有 一 个 临界 值 ,一 旦 超过 这 个 临界 值 就 会 发 生 抖动。 
造成 这 种 异常 现象 的 主要 原因 是 过 度 地 使 用 了 内 存 以 及 内 存 分 配 不 合理 。 因 为 每 个 进程 都 
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SN 








0 并 发 进程 数 入 
图 5-27 CPU 的 利用 率 与 内 存 中 并 发 进程 数 的 关系 图 


需要 占用 一 定 的 内 存 空 间 , 随 着 进程 数 的 增加 ,各 个 进程 所 分 得 的 实 页 数 就 会 减少 , 缺 页 现 
象 随 之 增多 ,从 而 导致 频繁 的 页 面 交换 ,进程 经 常 因 需 要 调 页 而 等 待 ,CPU 的 大 量 时 间 都 消 
耗 在 进程 调度 和 决定 页 面 淘汰 上 , 故 CPU 的 有 效 利用 率 很 低 。 当 然 , 如 果 内 存 中 并 发 进程 
数 过 少 ,CPU 利用 率 也 不 高 。 显 然 ,最 理想 的 情况 是 使 A 和 Up(CN) 近 C ,那么 ,并 发 进程 数 N 
如 何 确定 呢 ? 

并 发 进程 数 N 的 取 值 与 系统 为 进程 分 配 内 存 空 间 的 大 小 有 关 。 在 动态 页 式 管 理 系统 
中 ,从 原则 上 说 ,为 进程 分 配 的 实 页 数 越 多 ,进程 的 缺 页 率 就 越 小 ,但 并 发 进程 数 也 就 越 少 ， 
从 而 CPU 利用 率 下 降 ; 而 为 进程 分 配 的 实 页 数 过 少 ,进程 的 缺 页 率 就 会 增 大 ,可 能 导致 系 
统 发 生 抖动 。 图 5-28 给 出 了 进程 的 缺 页 率 Re 与 进程 占用 实 页 数 的 关系 。 从 图 5-28 可 见 ， 
如 果 一 个 进程 占有 的 实 页 数 能 满足 M; 三 MM ,那么 该 进程 就 获得 了 有 效 运行 所 需 的 足 
够 内 存 空间 , 缺 页 率 将 保持 在 合理 的 范围 内 。 如 果 每 个 进程 的 实 页 数 都 能 满足 M 所 M 达 
Met, 则 内 存 中 的 并 发 进程 数 就 是 合理 的 。 








1 
0 亿 Mt ”进程 的 实 页 数 作 


5-28 进程 的 缺 页 率 与 进程 占用 的 实 页 数 关 系 图 


总 之 ,为 防止 系统 抖动 现象 的 发 生 , 根 本 的 办 法 是 要 控制 系统 中 的 并 发 进程 数 以 及 为 各 
个 进程 分 配合 理 的 实 页 数 , 既 要 使 每 个 进程 都 有 足够 的 内 存 空间 ,又 要 使 系统 中 的 并 发 进程 
数 接近 最 佳 值 。 

防止 抖动 现象 的 发 生 通 常 有 两 种 方法 : 

一 种 是 选择 好 的 淘汰 算法 ,以 减少 缺 页 次 数 。 好 的 淘汰 算法 应 当 在 置换 页 面 时 尽 可 能 
选择 暂时 不 用 或 永久 不 用 的 页 ,使 内 存 中 存放 的 是 一 个 进程 一 段 时 间 内 所 需 的 页 。 

另 一 种 是 扩大 工作 集 。 所 谓 工 作 集 , 是 指 进程 在 某 个 时 间 段 里 要 访问 的 页 的 集合 。 如 
果 能 够 预知 进程 在 某 段 时 间 的 工作 集 , 并 在 此 之 前 把 该 集合 调和 内存, 至 该 段 时 间 终 了 时 ， 
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再 将 其 在 下 一 时 间 段 不 需要 访问 的 那些 页 换 出 内 存 , 这 样 就 可 以 减少 页 的 交换 。 但 是 一 个 
进程 在 某 段 时 间 内 的 工作 集 是 很 难 确定 的 。 事 实 上 ,由 于 各 进程 所 包含 的 程序 段 多 少 以 及 
选用 的 淘汰 算法 等 不 一 样 ,工作 集 的 选择 也 不 一 样 。 通 常 采 用 的 方法 是 , 当 进 行 页 置换 时 ， 
把 缺 页 的 进程 锁 住 , 不 让 其 换 出 ,而 调 入 的 页 占据 那些 暂时 得 不 到 执行 的 进程 所 占据 的 内 存 
区 域 ,从 而 扩大 缺 页 进程 的 工作 集 , 为 它 分 配 更 多 的 内 存 实 页 。 
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在 前 面 介绍 的 几 种 存储 管理 技术 中 ,用 户 的 逻辑 地 址 空间 被 连 成 一 个 一 维 (线性 ) 空 间 ， 
这 难于 满足 将 程序 按 其 逻辑 结构 划分 的 需求 ,从 而 不 便于 用 户 的 程序 和 数据 的 共享 ; 另外 ， 
在 实际 应 用 中 ,一 些 程序 段 和 数据 段 在 使 用 过 程 中 会 不 断 增 长 ,前 述 的 几 种 存储 管理 技术 都 
不 适用 于 这 种 动态 的 增长 。 于 是 人 们 提出 按 程序 的 逻辑 单位 段 来 分 配 内 存 的 段 式 存储 管理 
方案 , 它 同样 有 静态 分 配 和 动态 分 配 两 种 方式 。 


5.5.1 静态 段 式 存储 管理 


1. 基本 思想 


为 了 方便 程序 的 设计 ,用 户 按 程序 的 内 容 或 过 程 (函数 ) 关 系 把 自己 的 程序 分 段 , 每 段 都 
有 自己 的 名 字 。 当 一 个 进程 建立 时 ,以 段 为 单位 分 配 内 存 ,一 个 段 占 用 一 个 连续 的 内 存 区 
域 。 一 个 进程 的 各 个 段 可 以 存放 在 不 连续 的 区 域内 。 只 有 一 个 进程 所 有 的 段 都 可 得 到 足够 
的 内 存 空间 时 , 才 可 为 其 分 配 内 存 空 间 ,否则 拒绝 分 配 。 


2. 分 段 地 址 空间 和 地 址 结构 








段 式 存储 管理 中 ,一 个 用 户 作 业 或 程序 的 地 址 空间 被 划分 成 若干 个 段 ,每 个 段 定义 了 一 
组 逻辑 信息 ,每 段 的 长 度 由 相应 的 迎 辑 信息 组 成 的 大 小 决定 , 且 可 动态 增长 。 例 如 ,一 个 程 
序 可 有 主 程序 段 . 子 程序 段 .数据 段 与 栈 段 等 。 由 于 一 个 程序 被 分 成 多 个 段 ,因此 ,整个 程序 
的 地 址 空间 是 二 维 的 ,如 图 5-29 所 示 。 








CALL [XxX]l<Y> Y: 6: ci 
LOAD 1, [aA]16 
STORE 1, [B] |<C> 

















B 段 

















A 有 段 





X 段 


主 程序 段 main 





图 5-29 分 段 的 地 址 空间 


一 个 程序 中 每 段 都 有 自己 的 名 字 , 用 户 可 通过 段 名 和 段 内 符号 地 址 访问 其 他 的 段 。 
例如 : 
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CRLL [x]|<Y> ;转向 段 名 为 X 的 子 程序 的 人 口 点 了 

LOAD 1,[All6 ;将 段 名 为 A 的 数组 中 第 6 个 元 素 的 值 读 到 寄存 器 1 中 

STORE 1,[B]|<C> ”; 将 寄存 器 1 的 内 容 存 人 段 名 为 B`. 段 内 地 址 为 c 的 单元 中 

程序 经 过 编译 和 装配 后 ,每 段 的 段 名 被 译 成 唯一 的 段 号 ,每 个 段 是 一 个 首 地 址 为 零 的 连 
续 的 一 维 地 址 空间 ,CPU 访问 内 存单 元 的 指令 中 的 段 名 和 段 内 符号 地 址 经 编译 后 分 别 变 成 
段 号 和 段 内 相对 地 址 。 例 如 ,“CALL [X]|<YY >” 可 编译 成 “CALL 3,120”, 其 中 3 是 段 号 ， 
120 是 段 内 相对 地 址 。 因 此 , 段 式 管理 系统 中 ,程序 的 迎 辑 地 址 由 两 部 分 组 成 : 段 号 和 有 段 内 
相对 地 址 。 图 5-30 给 出 了 一 个 有 段 式 管理 的 逻辑 地 址 结构 示例 ,其 中 计算 机 CPU 的 有 效 地 
址 为 24 位 , 段 号 () 占 用 了 8 位 , 段 内 相对 地 址 (zw) 占 用 了 16 位 。 


23 16 15 0 








加 | w 








图 5-30 段 式 管理 中 的 逻辑 地 址 结构 示例 


一 旦 段 号 和 段 内 相对 地 址 的 长 度 确定 后 ,一 个 进程 允许 的 最 多 段 数 和 段 的 最 大 长 度 也 
就 限定 了 。 上 述 结构 表明 ,一 个 程序 允许 有 256 个 段 ,一 个 段 的 最 大 长 度 为 64KB。 


3. 数据 结构 


在 静态 段 式 存储 管理 中 ,为 了 实现 内 存 的 分 配 和 回收 以 及 逮 辑 地 址 到 物理 地 址 的 转换 ， 
需要 建立 以 下 几 种 数据 结构 。 

(1) 段 表 。 和 页 式 存储 管理 类 似 , 为 了 记录 每 个 段 在 内 存 中 的 存放 位 置 ,系统 为 每 个 进 
程 建 立 一 张 段 表 。 每 个 段 在 表 中 占有 一 个 表 项 ,其 中 包括 该 段 的 段 号 、 段 的 起 始 地 址 和 段 的 
长 度 等 ,如 图 5-31 所 示 。 
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图 5-31 段 . 段 表 及 段 在 内 存 空间 占用 情况 


(2) 内 存 空闲 区 表 ( 或 链 ) 。 因 为 段 式 存储 管理 以 段 为 单位 ,一 段 占 有 一 个 连续 的 区 域 ， 
因此 ,与 分 区 式 存储 管理 类 似 , 系 统 中 有 一 张 空闲 区 表 , 用 于 记录 当前 空闲 区 的 情况 。 每 一 
个 连续 的 空闲 区 在 其 中 占有 一 个 表 项 ,包括 空闲 区 的 大 小 和 起 始 位 置 。 

(3) 请 求 表 。 用 于 记录 系统 中 每 个 进程 的 段 表 始 址 和 段 表 长 度 。 请 求 表 通 常 由 每 个 进 


程 的 对 应 的 PCB 表 项 组 成 。 
4. 地 址 变换 


为 了 实现 地 址 变换 的 功能 ,系统 中 设置 了 一 个 段 表 寄存 器 , 当 一 个 进程 被 选中 执行 时 ， 
其 对 应 的 段 表 起 始 地 址 和 段 表 的 长 度 被 装 和 人 段 表 寄 存 器 。 每 当 CPU 访问 逻辑 地 址 (s,w) 
时 ,由 地 址 变换 机 构 实 现 地 址 的 变换 过 程 。 首 先 由 段 表 寄 存 器 中 的 段 表 始 址 得 到 该 段 的 段 
表 始 址 ,然后 以 段 号 为 索引 ,查找 段 表 ,找到 对 应 表 中 的 段 内 存 始 址 SD, 则 逻辑 地 址 (s,w) 
对 应 的 物理 地 址 为 SD 十 z。 由 此 实现 了 段 式 逻 辑 二 维 地 址 到 一 维 的 物理 地 址 的 转换 。 
图 5-32 给 出 了 段 式 存储 管理 的 地 址 变换 过 程 。 

控制 寄存 器 段 号 ys ”位 移 量 w 


段 表 始 址 | 段 表 长 度 一 人 一 2 100 有 效 地 址 
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与 页 式 存储 管理 相同 , 段 式 存储 管理 的 地 址 变换 过 程 也 使 得 访问 一 条 指令 须 经 过 二 次 
内 存 的 访问 。 即 首先 须 访问 段 表 ,得 到 对 应 的 段 在 内 存 的 始 址 ,然后 才 是 对 物理 地 址 的 访 
问 。 为 了 提高 访问 速度 ,解决 的 方法 与 分 页 系统 类 似 , 在 系统 中 增设 一 个 快 表 , 用 于 保存 最 
近 常 用 的 段 的 表 项 。 由 于 一 般 情况 下 段 比 页 大 ,因而 段 表 的 表 项 数目 比 页 表 的 表 项 数目 少 ， 
其 所 需 的 联想 寄存 器 也 比较 少 ,可 以 显著 地 减少 存 取 数据 的 时 间 。 


5. 内 存 分 配 和 释放 


在 分 段 分 配方 案 中 ,每 段 分 配 一 个 连续 的 内 存 区 域 ,如 图 5-31 所 示 。 由 于 各 段 长 度 不 
等 ,因而 各 段 所 占 的 存储 区 的 大 小 不 等 ,同一 进程 的 各 段 之 间 不 要 求 连 续 。 因 而 , 段 式 存储 
管理 的 内 存 分 配 和 释放 算法 与 可 变 式 分 区 的 管理 方法 类 似 , 系 统 由 相应 的 数据 结构 来 管理 
内 存 空 闲 区 ,分配 算法 可 采用 首次 适应 算法 、 最 佳 适应 算法 或 最 坏 适 应 算法 等 ,分 区 的 回收 
需要 进行 分 区 合并 。 所 不 同 的 是 ,可 变 分 区 以 进程 为 单位 ,而 静态 段 式 存储 管理 是 在 内 存 中 
有 可 用 空间 能 满足 进程 总 容量 的 前 提 下 ,以 段 为 单位 来 分 配 分 区 的 。 碎 片 问 题 同 样 是 不 可 
避免 的 ,需要 在 适当 的 时 候 进 行 碎片 拼接 。 

静态 段 式 存储 管理 中 ,由 于 进程 的 大 小 受 内 存 空闲 区 总 容量 的 限制 ,因此 ,同样 不 能 实 
现 内 存 的 扩充 。 
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5.5.2 动态 段 式 存储 管理 
1. 基本 思想 


在 动态 段 式 存储 管理 中 , 段 的 内 存 分 配 与 释放 是 在 进程 运行 过 程 中 动态 进行 的 。 当 一 
个 进程 准备 执行 时 , 段 式 存储 管理 程序 只 调 人 一 个 进程 的 若干 个 段 , 便 可 启动 进程 运行 。 进 
程 在 运行 中 根据 需要 随时 申请 调 人 新 段 和 释放 老 段 。 空 亲 区 的 分 配 和 释放 算法 与 静态 段 式 
存储 管理 类 似 , 所 不 同 的 是 , 当 访问 的 段 不 在 内 存 中 时 ,由 段 式 中 断 机 构 将 所 需 的 段 调和 人 内 
存 。 当 内 存 不 足 时 ,需要 从 内 存 中 选择 暂时 不 需要 的 段 淘 汰 ,以 便 调 和 新 的 段 。 

与 动态 页 式 存 储 管理 类 似 , 为 实现 从 逻辑 上 为 用 户 提 供 一 个 比 实际 更 大 的 虚拟 存储 空 
间 , 同 样 需要 一 定 的 硬件 和 相应 的 软件 支持 ,如 扩充 的 段 表 、 缺 段 中 断 机 构 、 地 址 变换 机 
构 等 。 


2. 段 表 


在 动态 段 式 存储 管理 中 ,系统 为 了 知道 所 访问 的 段 是 否 在 内 存 以 及 访问 的 段 的 状态 等 ， 
以 静态 段 式 存储 管理 为 基础 ,对 段 表 进行 了 扩充 ,如 下 所 示 : 








段 号 | 内 存 始 址 | 段 长 驻 留 位 | 访问 位 | 修改 位 | 外 存 地 址 | 存 取 方式 | 增补 位 
































其 中 各 字段 的 说 明 如 下 : 

(1) 驻 留 位 : 用 于 指示 该 段 是 否 在 内 存 。 

(2) 访问 位 : 用 于 记录 本 段 在 一 段 时 间 内 被 访问 的 次 数 ,或 记录 本 段 最 近 有 多 长 时 间 
未 被 访问 , 供 段 淘汰 时 参考 。 

(3) 修改 位 : 用 于 表示 该 段 在 调和 人 内存 后 是 否 被 修改 过 。 

(4) 外 存 地 址 : 用 于 指出 该 段 在 外 存 中 的 地 址 ,以 便 系统 从 外 存 中 调 入 该 段 。 

(5) 存 取 方 式 : 用 于 表示 本 段 的 存 取 权 限 ,以 限制 未 经 允许 的 用 户 访问 本 段 。 

(6) 增补 位 : 用 于 表示 本 段 在 执行 的 过 程 中 是 否 增长 过 。 


3. 缺 段 中 断 处 理 


在 动态 分 段 系统 中 , 当 CPU 所 要 访问 的 指令 或 数据 不 在 内 存 中 ,将 由 缺 段 中 断 机 构 产 
生 缺 段 中 断 信号 ,CPU 接收 到 这 个 信号 时 进入 缺 段 中 断 处 理 过 程 。 图 5-33 给 出 了 缺 段 中 
断 处 理 的 过 程 。 

在 新 段 调 入 的 时 候 , 分 为 以 下 几 种 情况 : 

(1) 如 果 内 存 中 有 一 个 足够 大 的 连续 的 空闲 区 可 以 容纳 新 调 入 的 段 ,修改 相应 的 数据 
结构 ,如 段 表 、 空 闲 区 表 等 ,完成 新 段 的 调和 人 。 

(2) 如 果 内 存 中 没有 一 个 大 于 或 等 于 新 段 的 连续 的 空闲 区 , 则 查找 空闲 区 表 , 如 果 内 存 
中 一 部 分 或 全 部 空闲 区 总 和 足够 容纳 新 段 , 则 进行 空闲 区 的 合并 以 形成 一 个 长 度 不 小 于 新 
段 的 空闲 区 ,修改 相应 的 数据 结构 ,调和 人 新 段 。 

(3) 当 内 存 中 所 有 的 空闲 区 的 总 和 不 足以 容纳 新 段 时 , 则 需 选择 一 个 或 几 个 暂时 不 需 
要 访问 的 段 淘汰 。 


虚 段 S 不 在 内 存 


阻塞 请 求 进程 





















空闲 区 容量 总 
和 能 否 满足 2 








从 外 存 读 入 段 S 








修改 段 表 及 内 存 空闲 区 表 





1 
空闲 区 拼接 ， 以 形成 淘汰 一 个 或 几 个 实 段 ， 以 
一 个 台 适 的 空闲 区 形成 一 个 合适 的 空闲 区 


























唤醒 请 求 进程 














返回 
图 5-33” 缺 段 中 断 处 理 过 程 


在 段 的 淘汰 过 程 中 ,如 果 调 入 的 是 一 个 小 段 , 则 使 用 FIFO 或 LRU 淘汰 算法 决定 一 个 
能 满足 需要 的 实 段 淘汰 ; 如 果 调 人 一 个 大 段 ,可 能 没有 一 个 实 段 能 满足 需求 ,这 就 需要 淘汰 
几 个 段 。 如 果 完 全 按照 FIFO 或 LRU 算法 的 原则 选择 淘汰 段 , 可 能 由 于 所 选择 的 段 不 是 连 
续 的 ,需要 进行 空闲 区 的 拼接 ; 如 果 从 空间 因素 的 需求 来 选择 淘汰 段 , 则 选择 能 满足 需求 的 
最 小 数目 的 相 邻 的 几 个 段 淘汰 ,但 是 这 种 策略 可 能 存在 一 种 危险 , 那 就 是 刚刚 被 淘汰 的 段 有 
可 能 立即 再 次 被 访问 。 可 见 ,动态 段 式 存储 管理 的 段 淘 汰 策略 比 动态 页 式 存 储 管理 更 复杂 ， 
它 要 考虑 空间 的 需求 .最近 将 来 被 访问 的 可 能 性 以 及 内 存 拼接 等 诸多 因素 。 通 常 ,对 一 种 具 
体 的 系统 淘汰 策略 主要 侧重 于 考虑 上 述 某 个 因素 。 


5.5.3 分 段 和 分 页 的 主要 区 别 


由 前 所 述 ,分 页 和 分 段 有 许多 的 相似 之 处 ,例如 ,都 采用 离散 式 的 分 配方 式 ,都 可 实现 虚 
拟 内 存 的 扩充 技术 ,地 址 变换 也 很 相似 。 但 是 二 者 在 管理 和 用 户 的 角度 上 有 很 大 的 差别 , 主 
要 表现 在 以 下 几 个 方面 : 

(1) 段 是 面向 用 户 的 ,页 是 面向 系统 的 。 段 是 信息 的 逻辑 单位 ,分 段 是 出 于 用 户 的 需 
求 ,对 用 户 是 可 见 的 ; 页 是 信息 的 物理 单位 ,分 页 是 用 户 不 可 见 的 ,只 是 为 了 便于 内 存 的 管 

(2) 页 的 大 小 是 固定 的 ,由 系统 决定 ; 段 的 大 小 不 固定 ,由 用 户 决定 。 

(3) 从 用 户 的 角度 看 ,分 页 系统 的 用 户 程序 空间 是 一 维 连续 的 空间 ; 段 的 地 址 空间 是 
二 维 的 ,由 段 名 和 段 内 相对 地 址 组 成 。 

(4) 从 管理 的 角度 看 ,分 页 系统 的 二 维 地 址 是 在 地 址 变换 过 程 中 由 系统 的 硬件 机 构 实 
现 的 ,对 用 户 是 透明 的 ; 分 段 系 统 的 二 维 地址 是 在 地 址 变换 过 程 中 由 用 户 提供 的 。 因 而 ,页 
内 没有 地 址 越界 问题 ,而 段 内 的 相对 地 址 则 存在 地 址 越界 问题 。 
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5.5.4 上段 的 信息 共享 


在 多 道 程序 环境 下 ,有 许多 的 系统 程序 ,如 编译 程序 、 编 辑 程序 .标准 的 库 程 序 等 ,经 常 
被 若干 个 进程 同时 访问 ,如 果 系 统 给 每 个 进程 的 地 址 空间 中 都 保留 同一 程序 的 一 份 副本 , 则 
对 内 存 存在 大 量 的 浪费 。 而 段 式 存储 管理 较 好 地 解决 了 这 个 问题 。 

在 页 式 存储 管理 和 段 式 存储 管理 中 ,都 可 实现 多 个 进程 共享 同一 内 存 块 里 的 程序 和 数 
据 。 对 于 段 式 存储 管理 来 说 ,被 共享 的 部 分 可 以 是 一 个 独立 的 段 ,物理 上 是 一 段 , 多 辑 上 也 
是 一 段 , 因 此 更 易于 实现 ,只 需 将 每 个 进程 的 段 表 中 对 应 的 共享 段 始 址 指向 相同 的 始 址 即 
可 ,如 图 5-34(a) 所 示 。 对 页 式 存储 管理 来 说 ,必须 保证 被 共享 的 程序 或 数据 占用 整数 据 块 ， 
以 便 与 非 共享 部 分 分 开 。 如 果 被 共享 的 部 分 占用 若干 块 ,那么 在 各 共享 者 的 页 表 中 就 有 若 
干 个 表 项 ,它们 所 指向 的 页 面 号 相同 ,如 图 5-34(b) 所 示 。 在 实际 应 用 中 ,很 难保 证 被 共享 
的 程序 和 数据 占用 整数 据 块 , 导 致 部 分 非 共享 的 代码 或 数据 被 放 入 共享 页 ,如 图 5-34(b) 中 
的 阴影 部 分 所 示 。 


进程 A 段 表 内 存 空间 


































































































长 度 | 地 址 
0 a 
a a | 进程 A 页 表 内 存 空间 
p | [' | 
EE 1 
aq+N-1 | 
进程 B 段 表 3 ': 
进程 B 页 表 Pd 
0 
1 
0 2 
1 3 叶 
2 n a 叶 
(a) 段 的 共享 (b) 页 的 共享 


图 5-34 内 存 信息 的 共享 


为 了 保证 各 个 进程 访问 的 共享 段 代 码 相同 ,共享 段 必 须 是 纯 过 程 。 但 事实 上 ,大 多 数 代 
码 在 执行 时 都 有 可 能 对 其 处 理 的 数据 进行 改变 。 为 此 ,各 共享 进程 都 必须 在 自己 的 存储 区 
域 分 别 有 一 套数 据 。 这 样 ,进程 在 执行 时 只 对 自己 的 数据 区 中 的 内 容 进行 修改 ,并 不 改变 共 
享 代 码 。 为 了 保证 共享 代码 不 被 修改 ,每 个 共享 段 的 存 取 控制 都 设置 为 不 可 写 。 

为 了 协调 分 段 的 共享 ,系统 中 可 设置 一 张 共享 段 表 ,每 一 个 共享 段 在 该 表 中 占有 一 个 表 
项 。 每 一 个 表 项 指出 该 段 是 否 在 内 存 ` 调 用 此 段 的 进程 名 .进程 号 等 情况 ,如 图 5-35 所 示 。 

当 一 个 共享 段 首次 被 系统 中 一 个 进程 调用 时 ,由 系统 为 该 段 分 配 一 块 内 存 区 域 ,同时 将 
该 区 的 始 址 填 人 请 求 进程 的 段 表 的 相应 项 中 ,还 在 共享 段 表 中 增设 一 组 表 目 ,填写 有 关 的 数 
据 ,如 ,共享 进程 计数 器 count 二 1, 该 段 的 段 名 、 段 长 ,内存 始 址 ,调用 进程 的 进程 名 、 进 程 
号 ,该 段 在 调用 进程 中 使 用 的 段 号 以 及 存 取 控制 等 。 此 后 , 当 又 有 进程 调用 该 共享 段 时 , 系 
统 查找 共享 段 表 ,看 该 段 是 否 已 在 内 存 中 ,如 果 在 ,那么 需 在 调用 进程 的 段 表 中 填写 该 段 的 
起 地 址 ; 在 共享 段 表 该 共享 段 对 应 的 表 项 中 执行 count = count 十 1, 填 写 调用 进程 的 名 




















六 段 名 | 段 长 | 内 存 始 址 | 状态 | 外 存 始 址 
共享 进程 计数 器 count 
状态 | 进程 名 | 进程 号 | 段 号 | 存 取 控制 












































共享 段 表 
图 5-35 共享 段 表 项 


称 、 进 程 号 、 存 取 控 制 等 。 当 某 一 进程 不 再 需要 某 一 共享 段 时 ,执行 count 一 count 一 1 操 
作 。 若 count 二 0, 表明 此 时 已 没有 进程 在 使 用 该 段 , 则 由 系统 收回 该 段 的 内 存 区 域 ,取消 
该 段 在 共享 段 中 所 对 应 的 表 项 。 

在 动态 段 式 存储 管理 中 , 当 某 一 个 共享 段 被 调 出 内 存 后 ,必须 在 共享 该 段 的 每 个 进程 相 
应 的 段 表 目 中 设置 其 状态 为 “不 在 内 存 ”。 相 反 , 当 一 个 共享 段 由 于 某 个 进程 的 调 入 重新 装 
入 内 存 后 ,共享 该 段 的 所 有 的 进程 对 应 的 段 表 目 需要 重新 调整 。 为 了 简化 调整 ,将 共享 段 
的 内 存 始 址 保存 在 共享 段 表 中 ,而 共享 该 段 的 所 有 进程 的 段 表 相应 的 表 目 总 是 指向 这 个 
共享 段 的 表 目 。 这 样 , 当 一 个 共享 段 被 装 入 内 存 或 移出 内 存 时 ,只 需 修改 共享 段 表 的 对 
应 表 目 。 


5.5.5 上 段 的 静态 链接 与 动态 链接 


通常 来 说 ,一 个 作业 或 一 个 进程 由 若干 个 程序 模块 组 成 ,而 这 些 模块 必须 经 过 编译 或 汇 
编 ,得 到 一 组 目标 模块 ,再 由 链接 程序 将 这 些 目 标 模块 链接 起 来 , 装 入 内 存 执行 。 根 据 链接 
时 间 的 不 同 ,又 可 将 链接 分 为 两 种 : 静态 链接 和 动态 链接 。 


1. 静态 链接 


静态 链接 是 指 程序 在 执行 之 前 ,由 链接 装配 程序 将 该 程序 的 所 有 目标 模块 进行 链接 和 
相对 地 址 重 定位 ,使 之 成 为 一 个 可 运行 的 目标 程序 。 

这 种 链接 既 可 以 在 程序 装 入 之 前 完成 ,也 可 以 在 程序 装 入 的 时 候 进 行 。 对 于 分 区 和 页 
式 存 储 管理 方案 ,程序 装 入 模块 必须 是 一 个 一 维 的 地 址 空间 ,因而 链接 时 需 对 目标 模块 中 所 
有 的 相对 地 址 进行 修改 ,如 图 5-36(a) 中 所 示 ,一 个 程序 经 过 编译 有 3 个 目标 模块 ,链接 后 如 
图 5-36(b) 所 示 。 对 于 静态 段 式 存储 管理 ,因为 一 个 程序 有 多 少 个 段 是 固定 的 ,所 以 链接 时 
由 装配 模块 给 每 一 段 一 个 段 号 , 据 此 将 目标 模块 中 的 所 有 段 名 修改 为 相应 的 段 号 ,如 
图 5-36(c) 所 示 。 

静态 链接 比较 简单 ,但 是 也 存在 一 些 缺 点 。 例 如 ,在 链接 时 需 对 目标 模块 中 的 一 些 相对 
的 地 址 进行 修改 ,因而 链接 时 间 长 ,有 时 链接 过 程 中 所 花费 的 时 间 有 可 能 比 程序 的 执行 时 间 
还 长 ; 链接 好 的 程序 段 在 运行 时 可 能 根本 不 会 用 到 (例如 ,程序 错误 处 理子 程序 ,在 程序 正 
确 的 情况 下 是 不 用 的 ), 但 程序 事先 无 法 确定 哪些 模块 会 用 到 ,只 能 将 所 有 的 模块 装 入 内 存 ， 
因而 造成 了 时 间 和 空间 上 的 浪费 。 
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0 
| 模块 A 模块 0 
CALL B 模块 A JSR "1 
L-1| Return JSR "LL" 三 1 | Return 
0 Return 0 模块 1 
模块 B Z| 模块 B 一 一 a 
CALL C i JSR "2 
USD M-l1 | Return 
M-1| Return be 
0 
| 模块 C tM| 模块 C 本 模块 2 
Return N-1| Return 


AN-1| Return 





























(a) 目标 模块 (b) 一 维 空间 装 入 模块 (9 二 维 空间 装 入 模块 
图 5-36 静态 链接 示例 


2. 动态 链接 


动态 链接 是 指 程序 在 执行 过 程 中 需要 某 一 段 时 ,再 将 该 段 从 外 存 调 入 内 存 , 把 它 与 有 关 
的 段 链接 在 一 起 。 这 样 , 凡 是 在 程序 执行 过 程 中 不 会 用 到 的 段 都 不 会 调 入 内 存 ,也 不 会 链接 
到 装 入 模块 上 ,因而 ,不 仅 能 加 快 程序 的 装 入 过 程 , 也 可 节省 大 量 的 内 存 空 间 。 

对 于 动态 段 式 存储 管理 方案 ,每 个 段 是 独立 的 程序 模块 ,又 有 各 自 的 段 名 , 且 可 以 动态 
分 配 内 存 空间 ,因而 易于 实现 动态 链接 。 下 面 通过 一 个 例子 给 出 MULTICS 系统 实现 动态 
链接 的 一 种 方法 。 

为 了 实现 动态 链接 ,在 MULTIC 系统 中 需要 有 进行 链接 中 断 的 硬件 机 构 及 间接 寻 址 
功能 。 在 程序 汇编 或 编译 时 , 当 遇 到 访问 外 段 的 指令 时 ,将 其 编译 成 一 条 间接 寻 址 指令 , 即 , 将 
访问 的 地 址 指向 一 个 间接 地 址 ,这 个 间接 地 址 被 称 为 间接 字 。 间 接 字 的 形式 如 图 5-37 所 示 。 


L D 
Lf 未 连接 ， 段 号 未 定 Le "Xey>" 
0: 已 连接 ， 段 号 已 定 逻辑 地 址 : 段 号 自 内 地 址 
图 5-37 间接 字 


当 工 ==1 时 ,表示 要 访问 的 段 还 没有 链接 好 ,此 时 ,D 为 符号 地 址 。 由 于 符号 地 址 可 能 很 
长 ,D 中 存放 不 下 ,所 以 D 中 实际 上 存放 了 指向 该 符号 串 的 首 地 址 。 当 工 =0 时 ,表示 此 段 已 
被 链接 ,此 时 ,D 中 存放 的 是 要 访问 的 多 辑 地 址 ,由 段 号 和 段 内 地 址 组 成 。 初 始 时 工 =1。 

例 5-6 如 图 5-38(a) 所 示 ,在 M 段 中 遇 到 访问 外 段 指令 “LOAD 1,[X]|<Y>” 时 ,将 
其 编译 成 “LOAD” 1,1|200”, 如 图 5-38(b) 所 示 。 在 此 ,假设 M 段 已 链接 好 并 分 得 段 号 为 
1,X 段 未 链接 好 (L 二 1) ,保存 在 文件 系统 中 ,指令 LOAD 1,[X]|<Y >” 的 间接 字 的 直接 
地 址 为 200。* 表示 间接 寻 址 ,7 表示 字符 串 “[X]|< Y >” 的 长度。 

当 程序 段 M 执行 到 *LOAD” 1,1|200” 时 ,由 于 200 单元 处 的 间接 字 中 的 链接 标志 工 一 
1 ,于 是 发 生 链接 中 断 , 转 和 人 链接 中 断 处理 程 序 。 它 首先 根据 间接 字 中 存放 的 符号 地 址 (此 处 
为 204) ,找到 符号 [XI|< 立 >, 从 外 存 中 将 和 段 调 入 内 存 , 并 且 分 配 一 个 段 号 (此 处 为 3); 然 
后 再 根据 Y 找到 段 内 地 址 (这 里 是 600); 最 后 ,修改 间接 字 中 的 值 , 置 L 二 0,D== (31600)， 
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M 段 100 LOap' 1,11200 
| 200| |1| …|1| 204 
LOAD 1, [X] |<Y> 204| 7[X] 1<Y> 
(a) 编译 前 (b) 编译 后 未 链接 
M 段 号 =1 














100| LORAD” 1,11200 






























200| [of …[3] 6oo 
204| [X] 1<Y> 














X 段 -3 





600| 1234 
(c) 链接 后 
图 5-38 动态 链接 示例 


至 此 链接 完成 ,如 图 5-38(c) 所 示 。 链 接 完 成 后 ,继续 执行 原 1 号 段 中 被 中 断 的 指令 
“LOAD* 1,11200”。 此 后 ,在 1 号 段 中 再 次 调用 该 指令 时 不 再 发 生 链接 中 断 。 

由 于 动态 链接 过 程 修改 了 链接 的 间接 字 , 与 共享 段 必 须 是 纯 代 码 相 矛 盾 。 因 此 ,在 动态 
链接 中 ,为 了 保证 段 的 共享 及 纯 代 码 ,一 种 解决 的 办 法 是 将 代码 段 分 为 纯 段 和 杂 段 两 部 分 ， 
即将 链接 的 间接 字 等 修改 的 内 容 放 在 杂 段 中 ,而 将 其 他 在 执行 过 程 中 不 会 改变 的 内 容 放 在 
纯 段 中 。 纯 段 可 共享 , 杂 段 不 共享 。 


5.5.6 上 段 式 存储 管理 的 内 存 保护 


段 式 存储 管理 的 内 存 保护 方法 主要 有 以 下 两 种 : 

(1) 地 址 越界 保护 法 。 可 在 每 个 进程 的 段 表 项 中 设置 每 一 段 的 段 长 。 当 进行 地 址 变换 
时 ,地 址 变换 机 构 首 先 依据 段 表 寄 存 器 中 的 段 表 长 度 ,判断 段 号 是 否 大 于 段 表 的 长 度 。 如 果 
超出 段 的 长 度 , 则 发 生 越 界 中 断 ; 如 果 没 有 超出 段 的 长 度 , 则 找到 对 应 的 段 表 项 ,将 段 内 相 
对 地 址 与 其 对 应 的 段 的 长 度 比较 。 这 样 , 每 个 进程 被 限制 在 自己 的 地 址 空间 中 运行 ,因而 不 
会 破坏 另 一 个 进程 的 地 址 空间 。 

这 里 要 说 明 的 是 ,在 允许 段 动 态 增长 的 系统 中 , 段 内 相对 地 址 可 以 大 于 段 的 长 度 。 一 个 
段 是 否 人 允许 动态 增长 ,由 段 表 的 增补 位 来 说 明 。 

(2) 存 取 控 制 保护 法 。 在 段 表 的 表 目 中 ,除了 指明 本 段 的 段 长 外 ,还 增加 了 存 取 方 式 控 
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制 项 。 这 种 段 的 保护 方式 ,对 非 共 享 段 来 说 ,主要 用 来 指示 程序 设计 的 错误 。 例 如 ,对 一 个 
过 程 段 应 只 能 执行 ,如 果 企 图 读 取 一 个 过 程 段 , 则 发 生 中 断 保护 。 而 对 共享 段 来 说 ,这 种 保 
护 则 更 为 重要 。 例 如 ,被 共享 的 纯 段 应 禁止 任何 进程 对 它 进 行 修改 。 这 样 既 可 保证 信息 的 
安全 ,又 可 满足 运行 的 需要 。 


5.5.7 上 段 式 存储 管理 的 优 缺 点 


段 式 存储 管理 有 以 下 优点 : 

(1) 便于 信息 的 共享 和 保护 。 由 于 在 分 段 管 理 中 ,每 个 程序 按 信息 的 逻辑 结构 构成 各 
自 独立 的 分 段 , 因 而 便于 对 完整 独立 的 信息 的 共享 和 保护 。 

(2) 实现 了 内 存 的 扩充 。 动 态 段 式 存 储 管理 与 页 式 存 储 管理 一 样 ,可 使 进程 的 大 小 不 
受 内 存 大 小 的 限制 ,从 而 实现 了 内 外 存 统一 管理 的 虚 存 。 

(3) 便于 信息 的 变化 处 理 。 在 实际 应 用 中 ,有 些 数据 段 需 要 不 断 吸取 和 增加 新 的 数据 ， 
因而 需要 对 段 进 行动 态 的 增长 。 而 在 段 式 存储 管理 中 ,以 段 为 单位 来 分 配 内 存 空间 ,因而 在 
一 个 分 段 的 后 面 增加 新 信息 ,不 会 影响 其 他 部 分 。 

(4) 便于 实现 动态 链接 。 由 于 分 段 管理 的 地 址 空间 是 二 维 的 , 且 每 一 个 分 段 是 一 个 具 
有 独立 功能 的 程序 段 , 因 而 在 进程 运行 过 程 中 ,可 以 在 调用 到 一 个 程序 段 或 一 个 数据 段 时 再 
去 进行 动态 链接 。 

段 式 存储 管理 有 以 下 缺点 : 

(1) 增加 了 计算 机 成 本 。 地 址 变换 需 硬件 支持 ; 缺 段 中 断 需 花费 处 理 机 时 间 ; 表格 的 
建立 和 管理 需 花费 处 理 机 时 间 , 且 占用 一 定 的 空间 。 

(2) 存在 碎片 问题 。 类 似 于 分 区 管理 ,内 存 中 存在 分 区 间 的 碎片 。 为 了 满足 段 的 动态 
增长 和 减少 碎片 , 需 采 用 拼接 技术 。 

(3) 段 的 长 度 受 内 存 可 用 空间 大 小 的 限制 。 

(4) 与 页 式 存储 管理 类 似 , 淘 汰 算法 选择 不 当时 可 能 产生 抖动 现象 。 


6.6 段 页 式 存储 管理 


前 面 介 绍 的 几 种 存储 管理 方案 各 有 所 长 。 段 式 存储 管理 大 大 方便 了 用 户 , 便 于 信息 共 
享 和 信息 的 动态 增加 ,但 存在 内 存 的 碎片 问题 。 页 式 存储 管理 则 大 大 提高 了 主 存 的 利用 率 ， 
但 不 便于 信息 的 共享 。 因 此 ,结合 二 者 的 优点 的 一 种 新 的 存储 管理 方案 被 提 了 出 来 ,这 就 是 
段 页 式 存储 管理 。 


5.6.1 实现 原理 
1. 基本 思想 





段 页 式 存 储 管理 对 用 户 来 说 与 段 式 存储 管理 相同 ,一 个 进程 仍 由 用 户 按照 程序 的 逻辑 
信息 划分 成 不 同 的 段 。 经 编译 和 链接 后 的 程序 ,每 个 段 有 唯一 的 段 号 。 因 而 ,用 户 地 址 空间 
仍 是 一 个 二 维 的 逻辑 虚 地 址 空间 。 而 对 于 系统 来 说 , 段 页 式 存储 管理 则 与 页 式 存 储 管理 相 
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同 ,内存 空间 被 划分 成 若干 个 大 小 相同 的 内 存 块 ,与 此 对 应 ,每 个 进程 的 每 个 段 被 划分 成 若 
干 个 与 内 存 块 大 小 相同 的 页 ,以 页 为 单位 来 分 配 内存 空 间 , 一 个 页 占用 一 个 内 存 块 。 这 样 ， 
一 个 进程 中 的 一 个 段 的 信息 可 以 存放 在 块 号 不 连续 的 内 存 块 中 ,分 段 的 大 小 不 受 内 存 大 小 
的 限制 。 


2. 数据 结构 


在 段 页 式 存储 管理 系统 中 ,为 了 实现 内 存 分 配 与 释放 、 缺 页 处 理 、 地 址 变换 等 ,系统 为 每 

一 个 进程 建立 一 张 段 表 ,每 个 段 建立 一 张 页 表 。 页 表 表 项 与 页 式 存 储 管理 的 页 表 表 项 相同 ， 

有 指向 页 对 应 的 存储 块 号 以 及 缺 页 处 理 和 页 面 保护 等 表 项 。 段 表 表 项 与 段 式 存储 管理 的 段 

表 表 项 类 似 , 不 同 的 是 ,原来 在 段 式 存储 管理 的 段 表 中 的 内 存 地 址 现在 变 为 指向 与 段 对 应 的 
页 表 的 起 始 地 址 。 段 页 式 存储 管理 中 段 表 、 页 表 以 及 内 存 的 关系 如 图 5-39 所 示 。 

段 表 地 址 寄存 器 








































































































段 表 长 度 | 起 始 地 址 页 号 [其 他 标 面 号 | 
G 1 12 - 
段 号 | 其 他 | 页 表 长 度 Ee] /A 2 19 
0 | 5 1024 3 21 
1 | 7 1029 4 8 
2 | 9 1036 5 10 
段 表 第 0 段 页 表 N 
页 号 | 其 他 | 页 面 号 
1 29 [一 | 
3 
第 2 段 页 表 内 存 


图 5-39 段 页 式 存储 管理 中 段 表 、 页 表 以 及 内 存 的 关系 


与 段 式 存储 管理 类 似 , 每 个 进程 有 对 应 的 PCB 表 项 用 于 记录 该 进程 对 应 的 段 表 始 址 和 
段 表 长 度 ,系统 中 有 用 于 记录 内 存 空闲 块 的 空闲 区 链表 。 


3. 地 址 结构 与 地 址 变换 


在 段 页 式 存储 管理 中 ,程序 的 分 段 由 程序 员 决 定 ,因此 ,对 用 户 来 说 ,用 户 的 地 址 空间 仍 
然 由 段 号 和 上段 内 相对 地 址 (5,w) 组 成 。 而 对 于 系统 来 说 ,以 页 为 单位 来 分 配 内 存 空间 ,地 址 
变换 机 构 将 根据 页 的 大 小 把 段 内 相对 地 址 解释 为 页 号 和 页 内 地 址 。 因 此 , 段 页 式 存储 管理 
系统 中 ,进程 的 地 址 空间 由 段 号 .页 号 、 页 内 地 址 (s,p,d)3 部 分 组 成 ,如 图 5-40 所 示 。 
23 16 15 12 11 0 
攻 p d _ 


图 5-40 段 页 式 管理 地 址 结构 示例 
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为 了 实现 地 址 的 变换 ,在 段 页 式 系统 中 设置 了 段 表 寄 存 器 ,用 于 存放 当前 运行 的 进程 的 
段 表 起 始 地 址 和 段 表 长 度 。 当 CPU 访问 一 个 逻辑 地 址 (s,w) 时 ,系统 首先 自动 将 地 址 分 成 
3 部 分 (5,p,d) ,然后 将 段 号 * 与 段 表 寄存 器 中 的 段 表 长 度 进行 比较 。 若 段 号 大 于 段 表 长 
度 , 则 越界 ,否则 ,根据 段 号 找到 对 应 的 段 的 页 表 始 址 ,再 利用 p 找到 对 应 的 页 的 内 存 块 号 
(页 面 号 ) ,最 后 ,将 页 内 地 址 与 找到 的 块 号 合并 ,形成 与 逻辑 地 址 对 应 的 物理 地 址 。 

显然 ,在 段 页 式 存储 管理 中 ,访问 内 存 的 指令 或 数据 需要 访问 内 存 3 次 ,因此 ,为 了 提高 
访 内 的 速度 ,在 系统 中 设置 联想 寄存 器 比 段 式 和 页 式 存储 管理 更 为 重要 。 在 联想 寄存 器 中 
存放 当前 最 常用 的 段 号 、 页 号 和 与 其 对 应 的 内 存 页 面 号 。 图 5-41 说 明了 采用 这 种 方案 的 地 
址 变换 过 程 。 





































































































控制 寄存 器 
+ 段 表 
十 一 -~ 
引 
1-~ ”页 表 
不 匹配 | 
四 块 号 
ee 。 (页面) 
GG 主 存 基本 直 严 本 
人 
。 (sp,d) 
| 了 _ 
二 
* | a E 存 中 的 
虚 地 址 存储 块 


图 5-41 段 页 式 管理 的 地 址 变换 过 程 


5.6.2 上段 页 式 存 储 管理 的 其 他 问题 


有 关 段 页 式 存储 管理 中 的 内 存 分 配 与 释放 ,存储 保护 、 缺 页 与 缺 段 处 理 等 ,对 在 段 式 存 
储 管理 和 页 式 存储 管理 中 提 到 的 方法 稍 作 修改 便 可 适用 ,在 此 不 再 袭 述 。 

因为 段 页 式 存储 管理 是 页 式 和 段 式 存储 管理 的 结合 ,具有 二 者 的 优点 。 但 是 由 于 它 增 
加 了 软件 管理 ,系统 的 管理 开销 也 随 之 增加 了 。 需 要 的 硬件 支持 和 内 存 占用 也 增加 了 。 而 
碎片 问题 与 页 式 存储 管理 一 样 存在 , 且 更 为 严重 。 另 外 ,如 果 不 采 用 联想 寄存 器 的 方式 提高 
CPU 的 访问 速度 ,将 会 大 大 降低 系统 的 执行 速度 。 


67 Linux 存储 管理 


Linux 系统 采用 了 虚拟 的 内 存 管理 机 制 , 即 交换 和 请 求 分 页 存储 管理 技术 。 这 样 , 当 进 
程 运行 时 ,不 必 把 整个 进程 的 映像 都 放 在 内 存 中 ,而 只 需 在 内 存 中 保留 当前 用 到 的 那 一 部 分 
页 面 。 当 进程 访问 到 某 些 尚未 装 入 内 存 的 页 时 ,就 由 核心 把 这 些 页 装 入 内 存 。 这 种 策略 使 
进程 的 虚拟 地 址 空间 映射 到 内 存 的 物理 空间 时 具有 更 大 的 灵活 性 ,通常 允许 进程 的 大 小 可 


大 于 可 用 内 存 的 总 量 ,并 允许 更 多 进程 同时 在 内 存 中 执行 。 
5.7.1 进程 虚 存 空间 的 管理 
1. 地 址 空间 
Linux 系统 中 ,进程 的 地 址 空间 是 由 虚拟 内 存 (Virtual Memory,VM) 组 成 的 ,对 当前 进 


程 而 言 , 只 有 属于 它 的 虚拟 内 存 是 可 见 的 。Linux 把 进程 的 虚拟 内 存 分 成 两 部 分 : 内 核 区 
和 用 户 区 。 操 作 系 统 内 核 的 代码 和 数据 等 被 映射 到 内 核 区 ,进程 的 可 执行 映像 (代码 和 数 
据 ) 被 映射 到 虚拟 内 存 的 用 户 区 。 由 体系 结构 决定 ,每 一 个 进程 都 有 一 个 独立 的 32 位 或 64 
位 的 连续 的 地 址 空间 。 进 程 虚拟 内 存 的 用 户 区 分 成 代码 段 .数据 段 、 堆 栈 以 及 进程 运行 的 环 
境 变 量 .参数 传递 区 域 等 。 进 程 在 运行 中 还 必须 得 到 操作 系统 的 支持 ,进程 的 虚拟 内 存 中 还 
包含 操作 系统 内 核 。 每 个 虚 存 区 域 具有 对 相关 进程 的 相关 权限 ,进程 只 能 访问 具有 相关 权 
限 的 区 域 。 

内 核 使 用 mm_struct 结构 体 来 表示 进程 的 地 址 空间 ,该 结构 体 包含 了 进程 地 址 空间 有 
关 的 全 部 信息 。 

mm_struct 结构 体 首 地 址 在 任务 结构 体 task_struct 成 员 项 mm 中 : 








struct mm struct * mm; 
struct mm_struct { 


int count; // 虚 存 区 域 的 个 数 

pgd t * pgd; // 为 指向 进程 页 表 的 指针 

unsigned long context; // 进 程 上 下 文 的 地 址 

可 // 代 码 段 .数据 段 ,堆栈 的 首尾 地 址 等 
struct vm_area_struct * mmap; // 内 存 区 域 链表 

struct vm_area_struct * mmap_avl; //WM 形成 的 红 黑 树 

struct semaphore mmap_sem; // 虚 存 区 的 信号 量 


}; 


2. 进程 的 虚 存 区 域 
一 个 虚 存 区 域 是 虚拟 内 存 空 间 中 一 个 连续 的 区 域 ,在 这 个 区 域 中 的 信息 具有 相同 的 操 
作 和 访问 特性 。 每 个 虚 存 区 域 用 一 个 vm_area_struct 结构 体 进行 描述 : 


struct vm area struct 


{ 


Struct mm_struct *# vm_mm; // 指 向 进程 的 mm_struct 结构 体 
unsigned long vm_start; // 虚 存 区 域 的 开始 地 址 
unsigned long vm_end; // 虚 存 区 域 的 终止 地 址 
pgprot_t vm_page prot; // 虚 存 区 域 的 页 面 的 保护 特性 
unsigned short vm flags; // 虚 存 区 域 的 操作 特性 

a //3VL 结构 

struct vm_operations struct * vm_ops; // 相 关 操 作 表 

unsigned long vm _offset; // 文 件 起 始 位 置 的 偏 移 量 


struct inode * vm inode; // 被 映射 的 文件 
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进程 虚 存 空间 的 结构 如 图 5-42 所 示 。 
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图 5-42 进程 虚 存 空间 的 结构 


3. 虚 存 空间 的 映射 和 虚 存 区 域 的 建立 


在 虚拟 存储 技术 中 ,用 户 的 代码 和 数据 (可 执行 映像 ) 等 并 不 是 完整 地 装 和 人 物理 内 存 ,而 
是 全 部 映射 到 虚拟 内 存 空间 。 在 进程 需要 访问 内 存 时 ,在 虚拟 内 存 中 “找到 ”要 访问 的 程序 
代码 和 数据 等 ,系统 再 把 虚拟 空间 的 地 址 转换 成 物理 内 存 的 物理 地 址 。 

Linux 使 用 do_mmap() 函 数 完成 可 执行 映像 向 虚 存 区 域 的 映射 ,由 它 建 立 有 关 的 虚 存 


unsigned long do_mmap(struct file * file, unsigned long addr, 
unsigned long len, unsigned long prot, 
unsigned long flags, unsigned long off) 
addr 是 虚 存 区 域 在 虚拟 内 存 空 间 的 开始 地 址 ; len 是 这 个 虚 存 区 域 的 长 度 ; file 是 指向 
该 文件 结构 体 的 指针 ; off 是 相对 于 文件 起 始 位 置 的 偏 移 量 ; 若 file 为 NULL, 称 为 匿名 映 
射 (anonymous mapping); prot 指定 了 虚 存 区 域 的 访问 特性 ; flag 指定 了 虚 存 区 域 的 属性 。 


5.7.2 Linux 的 分 页 式 存 储 管理 
1. 物理 内 存 的 页 面 管理 


Linux 对 物理 内 存 空 间 按照 分 页 方式 进行 管理 ,把 物理 内 存 划 分 成 大 小 相同 的 物理 页 
面 。 大 多 数 的 32 位 体系 支持 4KB 的 页 面 ,64 位 体系 结构 支持 8KB 的 页 面 。 
Linux 内 核 用 page 结构 体 表 示 每 个 物理 页 面 的 使 用 状况 : 


typedef struct page { 


struct page * next; // 把 page 结构 体 链接 成 一 个 双向 循环 链表 
Struct page * prev; 

struct inode * inode; // 有 关 文 件 的 并 节点 

unsigned long offset; // 在 文件 中 的 偏 移 量 

struct page * next_hash; //page 结构 体 连 成 一 个 哈 希 表 

atomic_t count; // 页 面 的 引用 次 数 

unsigned flags; // 页 面 的 状态 

unsigned dirty:16,age:8; // 表 示 该 页 面 是 否 被 修改 过 

struct wait_queue * wait; // 等 待 该 页 面 的 进程 队列 

unsigned long map_nr; // 物 理 页 号 


} mem map_t; 


2. Linux 的 三 级 分 页 结构 


三 级 分 页 结构 是 Linux 提供 的 与 硬件 无 关 的 分 页 管理 方式 。 当 Linux 运行 在 某 种 计算 
机 上 时 ,需要 利用 该 种 计算 机 硬件 的 存储 管理 机 制 来 实现 分 页 存储 。 

如 图 5-43 所 示 ,三 级 分 页 管理 把 虚拟 地 址 分 成 4 个 位 段 : 页 目录 、 页 中 间 目 录 、 页 表 、 页 
内 偏 址 。 其 中 ,页 目录 (Page Directory,PGD) 用 于 存放 页 中 间 目 录 的 地 址 ,页 中 间 目 录 
(Page Middle Directory,PMD) 用 于 存放 页 表 地 址 ,页 表 (Page Table,PTE) 用 于 存放 每 页 
对 应 的 存储 块 号 。 
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图 5-43 ”Linux 的 三 级 分 页 管理 


3. 内 存 的 分 配 与 释放 


Linux 中 用 于 内 存 分 配 和 释放 的 函数 主要 是 kmalloc() 和 kfree() ,它们 用 于 分 配 和 释 
放 连 续 的 内 存 空间 。 

在 使 用 kmalloc() 分 配 空闲 块 时 以 Buddy 算法 为 基础 。 对 kmalloc() 分 配 的 内 存 页 面 
块 中 加 上 一 个 信息 头 , 它 处 于 该 页 面 块 的 前 部 。 页 面 块 中 信息 头 后 的 空间 是 可 以 分 配 的 内 
存 空间 。 


void x* kmalloc(size t size, int priority) 


参数 size 是 申请 分 配 的 内 存 的 大 小 ,priority 是 申请 优先 级 。 
kfree() 用 于 释放 由 kmalloc() 分 配 的 内 存 空 间 : 
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void kfree(void * _ptr) 
ptr 是 kmalloc() 分 配 的 内 存 空 间 的 首 地 址 。 
4. 虚拟 内 存 的 申请 和 释放 


在 申请 和 释放 较 小 且 连 续 的 内 存 空间 时 ,使 用 kmalloc() 和 kfree() 在 物理 内 存 中 进行 
分 配 。 申 请 较 大 的 内 存 空 间 时 ,使 用 vmalloc()。 由 vmalloc() 申 请 的 内 存 空间 在 虚拟 内 存 
中 是 连续 的 ,它们 映射 到 物理 内 存 时 ,可 以 使 用 不 连续 的 物理 页 面 ,而 且 仅 把 当前 访问 的 部 
分 放 在 物理 页 面 中 。 

void * vmalloc(unsigned long size) 

void vfree(void * addr) 

可 以 看 到 vmalloc() 的 参数 size 指出 申请 的 内 存 的 大 小 。 分 配 成 功 后 返回 值 为 在 虚 存 
空间 分 配 的 虚 存 块 首 地 址 ,失败 后 返回 值 为 0。vfree() 用 来 释放 由 vmalloc() 分 配 的 虚 存 
块 ,参数 addr 是 要 释放 的 虚 存 块 首 址 。 


习题 


. 存储 管理 的 主要 内 容 有 哪些 ? 
. 什么 是 静态 地 址 重 定位 ? 什么 是 动态 地 址 重 定位 ? 二 者 各 有 什么 优 缺 点 ? 
. 内 存 信息 保护 常用 的 方法 有 哪 几 种 ? 它们 各 自 有 什么 特点 ? 
. 分 区 式 内 存 管理 有 哪 两 类 ? 它们 各 自 的 特点 是 什么 ? 
. 常用 的 分 区 内 存 分 配 算法 有 哪些 ? 比较 它们 的 优 缺点 。 
. 分 区 式 存储 管理 有 哪些 优 缺 点 ? 
. 简 述 页 式 存储 管理 的 基本 思想 及 优 缺 点 。 
. 动态 页 式 存储 管理 中 的 页 表 内 容 主要 有 哪些 ? 它们 各 自 有 什么 作用 ? 
. 什么 叫 快 表 ? 为 什么 要 引入 快 表 ? 
. 动态 页 式 存储 管理 有 哪些 常用 的 淘汰 算法 ?比较 它们 的 优 缺 点 。 
.什么 是 Belady 现象 ? 试 举 一 个 Belady 现象 的 例子 。 
12. 什么 是 抖动 现象 ? 如 何 防止 抖动 现象 的 产生 ? 
13. 什么 是 段 式 存储 管理 ? 段 式 存储 管理 与 页 式 存 储 管理 的 区 别 是 什么 ? 
14. 段 式 存储 管理 的 优 缺 点 是 什么 ? 
15. 段 页 式 存储 管理 的 基本 思想 是 什么 ? 
16. 为 什么 说 段 页 式 存储 管理 中 的 地 址 是 三 维 的 ? 
17. 什么 是 内 碎片 ? 什么 是 外 碎片 ? 
18. 某 操作 系统 采用 可 变 分 区 分 配 存储 空间 的 管理 方法 ,用 户 区 为 512KB 且 始 址 为 0， 
用 空闲 分 区 表 管 理 空闲 区 , 且 初 始 时 用 户 区 的 512KB 是 空闲 的 ,对 下 述 申请 序列 : 申请 
300KB, 申 请 100KB, 释 放 300KB, 申 请 150KB. 申 请 30KB, 申 请 40KB, 申 请 60KB, 释 放 
30KB, 回 答 下 列 问题 : 
(1) 采用 首次 适应 算法 ,给 出 空闲 分 区 表 内 容 (给 出 始 址 ,大 小 ) 。 


Oo 和 NRWwD- 


一 
二 oO 


(2) 采用 最 佳 适应 算法 ,给 出 空闲 分 区 表 内 容 ( 给 出 始 址 ,大 小 ) 。 
(3) 如 果 再 申请 100KB, 针 对 (1) 和 (2) 各 有 什么 结果 ? 
19. 在 一 个 页 式 存 储 管理 系统 中 , 某 进 程 的 页 表 如 表 5-1 所 示 。 已 知 页 面 大 小 为 
1024B, 试 将 逻辑 地 址 1011、2148、3000、4000、5012 转化 为 相应 的 物理 地 址 。 
表 5-1 某 进 程 的 页 表 
页 号 块 号 页 号 块 号 
0 2 2 
3 3 








口 王 











20. 在 一 个 段 式 存储 管理 系统 中 , 某 进程 的 段 表 如 表 5-2 所 示 。 
表 5-2 某 进程 的 段 表 








段 号 基地 址 段 长 /B 
0 219 600 
1 2300 14 
2 90 100 
3 1327 580 
4 1952 96 


试 给 出 下 列 各 逻辑 地 址 对 应 的 物理 地 址 : 
(0,430),(1,10),(2,88),(3,444),(4,112) 。 

21. 一 个 进程 的 访问 内 存 地 址 序列 如 下 : 
10,11,104,170,73,309,185,245,246,434,458,364 

(1) 若 页 大 小 为 100B, 给 出 访 页 顺序 。 

(2) 若 分 配 该 进程 的 内 存 空间 为 200B, 采 用 FIFO 淘汰 算法 时 , 它 的 缺 页 次 数 是 多 少 ? 
(3) 若 采用 LRU 淘汰 算法 ,给 出 缺 页 次 数 。 

22. Linux 内 存 采用 哪 种 存储 管理 机 制 ? 

23， Linux 的 地 址 结构 组 成 部 分 有 哪些 ? 





如 果 说 输入 输出 设备 是 计算 机 系统 的 五 官 与 四 肢 , 则 处 理 器 和 存储 器 是 计算 机 系统 的 
大 脑 。 输 入 输出 设备 是 用 户 与 系统 交互 的 工具 ,它们 把 外 部 的 信息 输送 给 操作 系统 ,再 把 经 
过 加 工 的 信息 返 送 给 用 户 。 有 效 地 管理 和 利用 这 些 设 备 是 操作 系统 的 主要 任务 之 一 。 

每 一 个 计算 机 系统 都 配置 了 各 种 各 样 的 输入 输出 设备 ,简称 I/O 设备 ,也 称 为 计算 机 
外 部 设备 。 每 一 种 LO 设备 具有 各 自 的 特点 \ 不 同 的 传输 方式 和 控制 方式 ,用 户 不 可 能 也 
不 需要 详细 了 解 这 些 IO 设备 的 控制 技术 ,它们 都 是 由 操作 系统 来 管理 的 。 设 备 管理 的 主 
要 任务 是 完成 用 户 提出 的 1/O 请 求 ,提高 /O 速率 及 改善 1/O 设备 的 利用 率 。 

本 章 主要 讲述 操作 系统 对 输入 输出 操作 的 控制 及 操作 系统 对 设备 的 管理 。 


@.1 设备 管理 概述 


操作 系统 中 的 设备 除了 指 进行 实际 操作 的 物理 设备 以 外 ,也 包括 控制 这 些 设备 进行 
1/O 操作 的 支持 设备 ,如 设备 控制 器 ,中 断 控制 器 .DMA 控制 器 .通道 等 。 操 作 系统 中 负责 
管理 输入 输出 设备 ( 即 控制 所 有 设备 以 完成 期 望 的 数据 传送 ) 的 部 分 称 为 I/O 系统 , 它 完成 
设备 管理 功能 。 


6.1.1 设备 的 分 类 


计算 机 系统 中 的 输入 输出 设备 从 键盘 、 鼠 标 、 显 示 器 、 打 印 机 、 磁 盘 驱 动 器 到 网 络 设备 ， 
种 类 繁多 ,特性 各 异 ,操作 方式 也 有 很 大 差别 ,从 而 使 操作 系统 对 设备 的 管理 变 得 十 分 复杂 。 
不 同 的 设备 对 应 不 同 的 管理 程序 ,而 同类 设备 可 利用 相同 的 管理 程序 或 做 少量 的 修改 即 可 ， 
因此 ,为 了 简化 设备 管理 程序 ,要 对 设备 进行 分 类 。 从 操作 系统 的 观点 看 ,设备 的 性 能 指标 
主要 有 数据 的 传输 速率 ,信息 交换 的 单位 、 设 备 的 共享 属性 等 。 以 下 将 按照 这 3 个 性 能 指标 
对 设备 进行 分 类 。 

1. 按 数据 的 传输 速率 分 类 

按 传输 速率 的 高 低 ,可 将 MO 设备 分 为 3 类 。 第 一 类 是 低速 设备 ,这 是 指 其 传输 速率 仅 
为 每 秒 几 个 字 节 至 数 百 个 字 节 的 设备 ,主要 有 键盘 鼠标、 语音 输入 输出 设备 等 。 第 二 类 是 


中 速 设备 ,这 是 指 其 传输 速率 在 每 秒 数 千 个 字 节 至 数 万 个 字 节 的 设备 ,典型 的 中 速 设备 有 行 
式 打印 机 、 激 光 打 印 机 等 。 第 三 类 是 高 速 设备 ,这 是 指 其 传输 速率 在 每 秒 数 兆 字 节 至 数 十 兆 
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字 节 的 设备 ,典型 的 高 速 设备 有 磁带 机 、 磁 盘 机 、 光 盘 机 等 。 
2. 按 信息 交换 的 单位 分 类 


按 信息 交换 的 单位 可 将 1/O 设备 分 成 两 类 。 一 类 是 块 设备 ,这 类 设备 用 于 存储 信息 。 
由 于 信息 的 存 取 总 是 以 数据 块 为 单位 ,所 以 可 以 共享 分 配 。 这 类 设备 又 称 为 直接 存 取 设备 ， 
它 属 于 有 结构 设备 。 典 型 的 块 设备 是 磁盘 ,每 个 盘 块 的 大 小 为 512B 一 4KB。 磁 盘 设 备 的 基 
本 特征 是 其 传输 速率 较 高 ,通常 每 秒 几 兆 字 节 ; 另 一 特征 是 可 寻 址 , 即 对 它 可 随机 地 读 写 任 
一 块 。 此 外 ,磁盘 设备 的 1/O 传输 常 采 用 DMA 方式 。 另 一 类 是 字符 设备 (character 
device) ,用 于 字符 的 输入 和 输出 。 因 其 基本 单位 是 字符 , 故 称 为 字符 设备 。 它 属于 无 结构 
设备 。 字 符 设备 的 种 类 繁多 ,如 交互 式 终端 打印 机 等 。 字 符 设备 的 基本 特征 是 其 传输 速率 
较 低 ,通常 为 每 秒 儿 个 字 节 至 数 千 字 节 ; 另 一 特征 是 不 可 寻 址 , 即 输 入 输出 时 不 能 指定 数据 
的 输入 源 地 址 及 输出 的 目标 地 址 ; 此 外 ,字符 设备 在 输入 输出 时 , 常 采 用 中 断 驱动 方式 。 


3. 按 设备 的 共享 属性 分 类 


按 设 备 的 共享 属性 可 将 1/O 设备 分 为 如 下 3 类 : 

(1) 独占 设备 。 这 是 指 在 一 段 时 间 内 只 允许 一 个 用 户 ( 进 程 ) 访 问 的 设备 , 即 临 界 资源 。 
因而 ,对 多 个 并 发 进程 而 言 ,应 互 斥 地 访问 这 类 设备 。 系 统一 旦 把 这 类 设备 分 配给 某 进 程 ， 
便 由 该 进程 独占 ,直至 用 完 释放 。 应 当 注 意 ,独占 设备 的 分 配 有 可 能 引起 进程 死 锁 。 

(2) 共享 设备 。 这 是 指 在 一 段 时 间 内 人 允许 多 个 进程 同时 访问 的 设备 。 当 然 ,从 宏观 上 
看 起 来 好 像 多 个 进程 在 同时 使 用 ,对 于 每 一 时 刻 而 言 ,该 类 设备 仍然 只 允许 一 个 进程 访问 。 
显然 ,共享 设备 必须 是 可 寻 址 和 可 随机 访问 的 设备 。 典 型 的 共享 设备 是 磁盘 。 共 享 设备 不 
仅 可 获得 良好 的 设备 利用 率 , 而 且 也 是 实现 文件 系统 和 数据 库 系 统 的 物质 基础 。 

(3) 虚拟 设备 。 这 是 指 通过 某 种 虚拟 技术 将 一 台独 占 设 备 变换 为 若干 台 虚拟 的 同类 设 
备 , 供 若干 个 用 户 ( 进 程 ) 同 时 使 用 。 例 如 ,采用 假 脱 机 技术 ,将 磁盘 的 一 部 分 作为 公共 缓冲 
区 以 代替 打印 机 ,用 户 对 打印 机 的 操作 实际 上 是 对 磁盘 的 存储 操作 ,使 慢 速 的 独占 打印 机 变 
成 了 可 共享 的 快速 的 打印 机 。 


6.1.2 设备 管理 的 目标 


设备 管理 的 主要 目标 是 屏蔽 1/O 设备 的 硬件 特性 ,向 用 户 提供 使 用 I/O 设备 的 方便 接 
口 ,充分 提高 设备 的 利用 率 。 因 此 ,设备 管理 应 完成 下 述 任务 : 

(1) 设备 配置 和 资源 分 配 。 由 于 系统 要 配置 各 种 1/O 设备 和 部 件 , 它 们 都 要 使 用 和 占 
用 一 定 的 系统 资源 ,包括 I/O 通道 .VO 地 址 、1/O 端口 中断 请 求 号 .DMA 等 ,可 能 在 硬件 
和 软件 上 会 产生 冲突 ,必须 由 系统 对 1/O 设备 进行 正确 的 配置 和 分 配 ,使 各 种 1/O 设备 协 
调 地 ,不 冲突 地 工作 。 而 即 插 即 用 技术 (简称 PnP 技术 ) 是 目前 解决 计算 机 系统 1/O 设备 与 
部 件 配置 问题 的 主要 应 用 技术 。 

(2) 设备 分 配 与 释放 。 响 应 进程 的 I/O 请 求 ,为 其 合理 .有效 地 分 配 进程 所 要 求 的 设备 
和 相应 的 设备 控制 器 ,通道 等 辅助 部 件 。 在 进程 使 用 完 设备 后 ,及 时 回收 进程 所 占用 的 
设备 。 

(3) 控制 设备 和 CPU 的 数据 交换 ,进行 数据 传输 。 针 对 不 同 的 设备 请 求 , 通 过 设备 处 
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理 程 序 或 设备 驱动 程序 完成 对 设备 的 直接 控制 。 

(4) 隐藏 设备 特性 。 提 供 独立 于 设备 的 统一 接口 ,使 用 户 和 设备 分 开 , 用 户 在 编制 程序 
时 不 涉及 具体 设备 ,系统 按 用 户 的 要 求 控制 设备 工作 。 另 外 ,这 个 接口 还 为 新 增加 的 用 户 设 
备 提供 一 个 和 系统 核心 相连 接 的 入 口 ,以 便 用 户 开发 新 的 设备 管理 程序 。 

(5) 提高 设备 利用 率 。 缓 解 CPU 和 外 设 之 间 速 度 不 匹配 的 矛盾 , 尽 可 能 提高 设备 和 设 
备 之 间 、CPU 和 设备 之 间 以 及 进程 之 间 的 并 发 程度 ,充分 利用 设备 资源 。 


6.1.3 设备 控制 器 


为 了 实现 更 加 模块 化 和 更 通用 的 设计 ,通常 设备 和 CPU 通过 设备 控制 器 通信 。 微 型 
机 和 小 型 机 中 的 设备 控制 器 通常 是 主板 上 的 芯片 ,或 者 是 插入 扩展 槽 中 的 印刷 电路 卡 , 可 将 
它 插入 计算 机 ,因而 也 常 称 为 接口 卡 或 适配器 。 

设备 控制 器 的 主要 职责 是 控制 一 个 或 多 个 I/O 设备 ,以 实现 1/O 设备 和 CPU 之 间 的 
数据 交换 。 它 是 CPU 与 IO 设备 之 间 的 接口 ,如 图 6-1 所 示 , 由 若干 专用 寄存 器 和 相应 的 
逻辑 电路 构成 。 每 一 个 寄存 器 都 有 一 个 端口 地 址 ,CPU 通过 寄存 器 与 设备 进行 通信 。 通 过 
写 入 这 些 寄存 器 ,操作 系统 可 以 命令 设备 发 送 数 据 、 接 收 数据 、 开 启 、 关 闭 , 或 者 执行 其 他 操 
作 。 通 过 读 取 这 些 寄存 器 ,操作 系统 可 以 了 解 设备 的 状态 、 是 否 准 备 好 接收 一 个 新 的 命 


令 等 。 





1/O 接 口 电路 








数据 寄存 器 | 一 一 ~| 








-- 1 1/O 设 备 
状态 寄存 器 


























控制 寄存 器 
止 一 一 一 一 一 一 一 一 一 二 
图 6-1 设备 控制 器 


设备 控制 器 的 主要 功能 如 下 。 
1. 接收 和 识别 命令 


CPU 可 以 向 控制 器 发 送 多 种 不 同 的 命令 ,设备 控制 器 应 能 接收 并 识别 这 些 命令 ,为 此 ， 
在 设备 控制 器 中 应 有 相应 的 控制 寄存 器 ,用 来 存放 接收 的 命令 和 参数 ,并 对 所 接收 的 命令 
行 译 码 。 例 如 ,磁盘 控制 器 可 以 接收 CPU 发 来 的 Read、Write、Format 等 15 条 不 同 的 命 
令 , 有 些 命令 还 带 有 参数 ; 相应 地 ,在 磁盘 控制 器 中 有 多 个 寄存 器 和 命令 译 码 器 等 。 


2. 数据 交换 


在 输出 时 ,通过 数据 总 线 , 由 CPU 并 行 地 把 数据 写 入 设备 控制 器 的 数据 寄存 器 中 , 然 
后 才 以 WO 设备 所 具有 的 速率 将 寄存 器 中 的 数据 传送 给 I/O 设备 ; 在 输入 时 ,从 1/O 设备 
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送 来 的 数据 首先 放 在 设备 控制 器 的 数据 寄存 器 中 ,再 由 CPU 在 适当 的 时 候 将 其 送 到 指定 
的 存储 单元 中 。 


3. 标识 和 报告 设备 的 状态 


设备 控制 器 应 记 下 设备 的 状态 供 CPU 了 解 。 例 如 , 仅 当 一 个 设备 处 于 发 送 就 绪 状 态 
时 ,CPU 才能 启动 设备 控制 器 从 该 设备 中 读 出 数据 。 为 此 ,在 设备 控制 器 中 应 设置 一 个 状 
态 寄存 器 ,用 其 中 的 某 一 位 来 反映 设备 的 某 一 种 状态 。 当 CPU 读 入 该 寄存 器 的 内 容 后 , 便 
可 了 解 该 设备 的 状态 。 


4. 地 址 识别 


就 像 内 存 中 的 每 一 个 单元 都 有 一 个 地 址 一 样 ,系统 中 的 每 一 个 设备 也 都 有 一 个 地 址 ,而 
设备 控制 器 又 必须 能 够 识别 它 所 控制 的 每 个 设备 的 地 址 。 此 外 ,为 使 CPU 能 向 (或 从 ) 寄 
存 器 中 写 人 (或 读 出 ) 数 据 , 这 些 寄存 器 都 应 具有 唯一 的 地 址 。 例 如 ,在 IBM-PC 中 规定 , 硬 
盘 控 制 器 中 各 寄存 器 的 地 址 为 320H 一 32FH 之 一 。 设 备 控制 器 应 能 正确 识别 这 些 地 址 ,为 
此 ,在 设备 控制 器 中 应 配置 地 址 译 码 器 。 


5. 差错 控制 


设备 控制 器 还 兼 管 对 由 IO 设备 传送 来 的 数据 进行 差错 检测 。 若 发 现 传送 中 出 现 了 
错误 ,通常 是 将 差错 检测 码 置 位 ,并 向 CPU 报告 ,于 是 CPU 将 本 次 传送 来 的 数据 作废 ,并 
重新 进行 一 次 传送 。 这 样 便 可 保证 数据 输入 的 正确 性 。 


6.1.4 IO 系统 的 层次 结构 


计算 机 系统 通过 硬件 控制 驱动 技术 和 软件 驱动 来 完成 整个 LO 操作 。 前 者 是 1/O 设 
备 厂商 设计 的 与 设备 密切 相关 的 技术 ,这 些 技术 对 设备 依赖 性 很 大 。 后 者 涉及 系统 所 有 的 
1/O 处 理 软件 。 为 了 使 这 两 者 都 对 用 户 透明 ,方便 用 户 使 用 ,由 操作 系统 本 身 来 自动 处 理 
W/O 设备 的 请 求 . 操 作 和 了 驱动。 因此 ,1/O 系统 (设备 管理 软件 ) 将 独立 于 设备 ,操作 系统 内 
核 中 只 保留 与 设备 无 关 的 那 部 分 软件 ,而 将 与 设备 有 关 的 驱动 软件 作为 一 种 可 装 印 的 程序 ， 
可 以 按照 系统 配置 的 需求 进行 配置 。 在 实际 应 用 中 我 们 也 经 常 看 到 ,一 些 操作 系统 中 只 要 
安装 了 相应 的 设备 驱动 程序 ,就 可 以 方便 地 使 用 新 的 1/O 设备 。 

操作 系统 中 的 I/O 系统 软件 一 般 分 为 几 个 层 














次 ,如 中 断 处 理 程序 ,设备 驱动 程序 、 独 立 于 设备 的 (WO 请 求 ) 用 户 级 的 MO 软件 。 |(1/O 应 答 》 
系统 软件 和 用 户 级 软件 。 低 层 软件 用 来 屏 项 硬件 的 二 | ao | 
具体 细节 ,高 层 软件 主要 为 用 户 提供 一 个 简洁 .规范 。 | 
的 界面 。 图 6-2 给 出 了 1/O 系统 的 层次 结构 及 各 层 设备 驱动 程序 
之 间 的 通信 关系 (用 箭头 表示 )。 er 
1. 用 户 级 的 1/0 软件 t 
硬件 











1/O 系统 向 用 户 程序 提供 一 组 访问 设备 的 系统 
调用 命令 ,它们 是 用 户 程序 和 I/O 系统 之 间 的 接口 ， 图 6-2 1/O 系统 的 层次 结构 
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这 种 接口 是 与 设备 无 关 的 ,无 论 访问 什么 设备 ,使 用 的 都 是 相同 的 系统 调用 命令 。 通 常 的 系 
统 调用 是 由 库 函 数 实现 的 。 例 如 ,一 个 用 C 语言 编写 的 程序 可 能 包含 如 下 的 系统 调用 : 
read(dev,addr,size) ,其 中 ,dev 是 逻辑 设备 名 ,addr 是 所 传输 的 信息 在 内 存 的 地 址 ,size 是 
要 传输 的 字 节 数 。 标 准 的 1/O 库 函 数 包 含 了 许多 涉及 1/O 的 过 程 ,它们 都 是 作为 用 户 程 序 
的 一 部 分 运行 的 。 通 常 这 些 库 函 数 所 做 的 主要 工作 是 把 系统 调用 所 需 的 参数 传送 给 独立 于 
设备 的 系统 软件 ,由 其 他 的 MO 过 程 实现 真正 的 操作 。 


2. 逻辑 |/0 系统 


这 层 软件 通常 也 称 为 与 硬件 无 关 的 逻辑 I/O 系统 。 它 屏蔽 了 硬件 的 特性 ,向 用 户 提供 
独立 于 设备 的 统一 接口 ,完成 所 有 设备 都 应 实现 的 功能 。 它 的 主要 功能 如 下 : 

(1) 接收 用 户 使 用 系统 调用 发 来 的 1/O 请 求 , 构 造 IO 包 , 把 它 传 送 给 设备 驱动 程序 ， 
启动 设备 驱动 程序 完成 1/O 任务 。 

(2) 实现 逻辑 设备 到 物理 设备 驱动 程序 的 映射 。 为 了 保证 设备 的 独立 性 ,在 操作 系统 
的 1/O 软件 中 ,对 输入 输出 设备 统一 命名 ,由 逻辑 I/O 系统 负责 把 设备 的 符号 名 映射 到 相 
应 的 设备 驱动 程序 上 。 

(3) 负责 设备 的 分 配 和 释放 。 对 设备 的 使 用 请 求 进行 检查 ,并 根据 申请 设备 的 使 用 状 
况 决 定 是 接收 该 请 求 还 是 拒绝 该 请 求 。 

(4) 管理 1/O 缓冲 。 负 责 缓冲 区 的 申请 与 释放 ,控制 1/O 缓冲 与 内 存 之 间 的 数据 传输 。 

(5) 接收 设备 驱动 程序 的 应 答 ,并 向 用 户 发 送 1/O 完成 的 情况 。 

(6) 负责 必要 的 出 错 处 理 。 一 般 来 说 ,出 错 处 理 是 由 设备 驱动 程序 完成 的 。 大 多 数 错 
误 是 与 设备 密切 相关 的 ,因此 ,只 有 设备 驱动 程序 知道 应 如 何 处 理 ( 如 重 试 、 忽 略 或 取消 )。 
但 还 有 一 些 错误 是 与 设备 无 关 的 ,如 设备 驱动 程序 重 试 失败 , 则 通知 馆 辑 I/O 系统 ,至 于 如 
何 处 理 这 个 错误 则 与 设备 无 关 了 。 





3. 设备 驱动 程序 


所 有 涉及 物理 操作 特性 的 I/O 处 理 都 由 I/O 系统 中 较 低 层 的 软件 完成 ,主要 包括 设备 
驱动 程序 和 IO 中 断 处 理 程序 ,对 设备 的 使 用 转变 为 对 设备 驱动 程序 的 调用 。 

设备 驱动 程序 由 设备 服务 子 程序 和 中 断 处 理 程序 组 成 。 设 备 驱 动 程序 处 理 一 种 设备 或 
者 一 类 密切 相关 的 设备 ,程序 代码 依赖 于 设备 操作 。 它 的 主要 工作 是 : 接收 上 层 发 来 的 
1/O 请 求 , 对 它 进 行 从 抽象 到 物理 的 转换 ,构造 出 相应 的 操作 命令 (例如 ,对 于 磁盘 ,将 请 求 
的 盘 块 号 映射 成 物理 地 址 ); 检查 设备 的 状态 是 否 正常 ,然后 决定 需要 设备 控制 器 执行 哪些 
操作 ,将 1/O 操作 送 入 设备 控制 器 ,启动 设备 控制 器 ; 收集 设备 完成 后 的 结果 状态 ,传送 到 
上 层 软 件 。 


4. MO 中 断 处 理 程序 


WO 中断 处 理 程序 位 于 最 底层 , 它 响 应 1/O 的 中 断 请 求 , 完 成 相应 的 中 断 处 理 。1/O 中 
断 处 理 程序 的 基本 工作 包括 : 保留 现场 ; 唤醒 因 等 待 该 IO 操作 完成 而 被 阻塞 的 某 个 进程 
(如 设备 驱动 进程 或 请 求 IO 的 进程 ) ,通知 该 进程 I/O 已 完成 ; 最 终 转 入 进程 调度 程序 重 
新 进行 调度 。 
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下 面 通过 一 个 例子 来 说 明 1/O 的 控制 过 程 。 一 个 用 户 进程 在 运行 过 程 中 通过 系统 调 
用 write(dev,addr,size) 向 一 个 磁盘 文件 写 入 一 组 数据 时 ,系统 调用 将 向 逻辑 I/O 系统 发 送 
一 个 I/O 请求, 用 户 进 程 将 进入 阻塞 状态 ,等 待 数 据 传输 的 完成 。 人 逻辑 I/O 系统 接收 该 请 
求 ,检查 相应 的 设备 是 否 已 准备 好 ,为 数据 传输 分 配 必要 的 缓冲 ,调用 相应 的 磁盘 驱动 程序 ， 
完成 数据 传输 。 然 后 ,由 硬件 产生 一 个 中 断 , 转 和 中断 处 理 程序 。 中 断 处 理 程序 检查 中 断 的 
原因 ,知道 是 磁盘 读 取 操作 已 完成 ,于 是 将 完成 信息 传送 给 磁盘 驱动 程序 ,由 磁盘 驱动 程序 
将 数据 传送 完成 的 情况 传送 给 逻辑 IO 和 系统。 逻辑 1/O 系统 唤醒 用 户 进程 ,结束 此 次 IO 

在 随后 的 各 节 中 将 由 低 到 高 依次 讨论 这 几 个 层次 的 一 些 关键 技术 。 


6.2 数据 传送 控制 方式 


操作 系统 不 是 直接 与 设备 打交道 ,而 是 与 设备 控制 器 ( 即 硬件 接口 ) 打 交道 。 接 口 的 结 
构 及 功能 不 同 ,传送 方式 不 同 ,从 而 使 CPU 对 外 设 的 控制 方式 也 不 同 。 常 用 的 数据 传送 控 
制 方式 主要 有 以 下 几 种 。 


6.2.1 程序 直接 控制 方式 


程序 直接 控制 方式 就 是 由 用 户 进程 来 直接 控制 内 存 或 CPU 和 外 设 之 间 的 信息 传送 。 
即 当 用 户 进程 需要 传输 数据 时 ,通过 CPU 向 设备 发 出 启动 设备 的 命令 ,然后 用 户 进程 进入 
等 待 测 试 状态 。 输 入 数据 时 ,CPU 向 设备 控制 器 发 出 一 条 1/O 指令 启动 输入 设备 输入 数 
据 , 同 时 把 设备 控制 器 的 状态 寄存 器 中 的 忙 / 闲 标志 Busy 置 为 1, 用户 进程 进入 等 待 测试 状 
态 。 在 等 待 时 间 内 ,CPU 不 断 地 循环 测试 Busy, 当 Busy=1 时 ,表示 输入 设备 尚未 输入 完 
一 个 字符 ,处 理 机 应 继续 对 该 标记 进行 测试 ,直到 Busy=0。 当 输入 设备 的 数据 准备 好 后 ， 
发 出 一 个 选 通信 号 ,该 信号 把 数据 送 入 数据 寄存 器 ,也 把 Busy 置 为 0, 表明 输入 设备 已 将 数 
据 送 入 控制 器 的 数据 寄存 器 中 ,于 是 处 理 机 将 数据 从 数据 寄存 器 中 取出 , 送 入 指定 单元 中 ， 
这 样 便 完成 了 一 个 字符 的 输入 。 接 着 再 次 启动 , 读 下 一 个 数据 ,直到 完成 本 次 传送 的 数据 。 
反之 , 当 用 户 进程 需要 输出 数据 时 ,同样 发 出 启动 命令 启动 设备 进入 等 待 测试 状态 ,直到 
设备 准备 好 后 才能 输出 数据 。 图 6-3 给 出 了 程序 直接 控制 方式 的 外 设 和 CPU 的 处 理 
流程 。 

程序 直接 控制 方式 控制 简单 ,也 不 需要 太 多 的 硬件 支持 ,但 是 存在 下 列 缺 点 : 

(1) CPU 利用 率 低 。 由 于 CPU 和 外 设 之 间 只 能 串 行 工 作 , 而 CPU 的 速度 又 大 大 高 于 
外 设 的 工作 速度 ,所 以 CPU 的 大 量 时间 处 于 空闲 状态 。 

(2) 不 能 充分 发 挥 设 备 的 使 用 效率 。 由 于 CPU 在 一 段 时 间 内 只 能 与 一 个 设备 进行 数 
据 交换 ,所 以 设备 与 设备 之 间 不 能 并 行 工 作 。 

(3) 不 能 处 理 外 设 发 生 的 错误 。 由 于 程序 直接 控制 方式 依靠 测试 设备 控制 器 的 状态 寄 
存 器 的 标志 来 控制 数据 的 传送 ,因此 无 法 发 现 和 处 理 设备 或 其 他 硬件 所 产生 的 错误 。 

程序 直接 控制 方式 只 适用 于 那些 执行 速度 较 慢 、 外 设 较 少 的 系统 。 
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图 6-3 程序 直接 控制 方式 的 处 理 流程 
6.2.2 中 断 控制 方式 
随 着 中 断 技术 的 出 现 和 多 道 程序 技术 的 引入 ,外 设 与 CPU 之 间 数 据 传送 控制 引入 了 


中 断 方式 。 这 种 方式 要 求 外 设 接 口 电路 有 相应 的 中 断 线 , 同 时 在 设备 控制 器 的 状态 寄存 器 
中 有 相应 的 中 断 请 求 允许 位 。 图 6-4 给 出 了 中 断 控制 方式 的 处 理 流程 。 
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但 
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被 中 断 进程 执行 
(a) 外 设 处 理 流程 (b) CPU 处 理 流 程 


6-4 中 断 控制 方式 的 处 理 流程 
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当 进 程 执行 要 求 从 一 个 指定 的 设备 输入 数据 时 ,由 CPU 向 设备 发 出 一 条 I/O 命令 启 
动 输入 设备 输入 数据 ,同时 将 设备 控制 器 的 状态 寄存 器 的 中 断 请 求 允许 位 打开 ,以 便 在 需要 
时 中 断 程序 可 以 被 调用 。 而 当前 进程 将 转 入 阻塞 状态 ,等 待 数 据 传输 的 完成 ,由 调度 程序 调 
度 其 他 进程 执行 。 设 备 控制 器 按照 命令 要 求 去 控制 指定 的 输入 设备 ,完成 数据 的 输入 操作 。 
此 时 ,设备 和 CPU 并行 工 作 。 输 入 设备 将 数据 送 入 数据 寄存 器 ,同时 ,由 中 断 线 发 出 一 个 
中 断 信号 。CPU 每 执行 完 一 条 命令 后 , 便 去 检测 中 断 线 ,询问 是 否 有 中 断 请 求 。CPU 检测 
到 中 断 信号 后 ,调用 相应 的 中 断 处 理 程序 ,将 数据 从 数据 寄存 器 中 取出 , 送 到 指定 的 内 存单 
元 中 。 

如 果 要 将 一 组 数据 送 到 指定 的 设备 输出 时 ,CPU 向 设备 发 出 一 条 I/O 命令 启动 输出 设 
备 输出 数据 ,同时 将 输出 数据 送 入 数据 寄存 器 ,设备 控制 器 控制 设备 将 数据 从 数据 寄存 器 输 
出 。 同 样 ,当前 进程 阻塞 ,CPU 可 转 去 执行 其 他 操作 。 在 设备 输出 数据 完成 后 ,向 CPU 发 
一 个 中 断 信 号 ,CPU 检测 到 中 断 信 号 后 ,调用 相应 的 中 断 处 理 程序 完成 数据 的 处 理工 作 。 

中 断 控制 方式 使 CPU 发 出 启动 设备 的 命令 后 ,没有 像 程 序 直接 控制 方式 那样 去 循环 
测试 外 设 的 工作 状态 ,而 是 调度 其 他 进程 开始 执行 。 显 然 ,在 CPU 执行 其 他 进程 时 ,也 可 
以 启动 不 同 的 设备 工作 。 因 此 ,与 程序 直接 控制 方式 相 比 ,中 断 处理 方 式 可 以 使 外 设 与 外 
设 .CPU 与 外 设 并 行 工 作 , 从 而 大 大 提高 了 系统 的 使 用 效率 。 但 该 方式 依然 存在 下 列 缺点 。 

(1) 处 理 中 断 花费 大 量 的 处 理 机 时 间 。 由 于 1/O 设备 控制 器 中 的 数据 寄存 器 通常 较 
小 ,而 中 断 处 理 方式 是 每 当 数 据 寄 存 器 满 时 便 发 生 一 次 中 断 , 因 此 ,在 一 次 传送 数据 过 程 中 ， 
如 果 传 送 的 数据 较 多 ,发 生 中 断 的 次 数 也 较 多 ,这 将 使 CPU 花费 大 量 的 时 间 去 处 理 中 断 。 

(2) 传送 数据 容易 丢失 。 当 系统 配置 的 外 设 较 多 ,采用 中 断 处 理 方式 并 行 工作 的 设备 
较 多 时 ,中 断 次 数 会 急剧 增加 ,从 而 造成 CPU 无 法 响应 中 断 , 出 现 数据 丢失 现象 。 另 外 ,在 
中 断 控制 方式 中 ,我们 都 是 假设 外 设 的 速度 比较 慢 , 而 CPU 处 理 速度 足够 快 。 也 就 是 说 ， 
当 设备 把 数据 放 和 人 数据 寄存 器 并 发 出 中 断 信 号 之 后 ,CPU 有 足够 的 时 间 在 下 一 组 数据 进入 
数据 寄存 器 之 前 取 走 这 些 数据 。 但 是 如 果 外 设 的 速度 比较 快 , 则 可 能 造成 数据 寄存 器 中 的 
数据 还 没有 被 CPU 取 走 ,下 一 组 数据 就 由 设备 送 入 数据 寄存 器 ,从 而 使 前 一 组 数据 丢失 。 


6.2.3 ”DMA 控制 方式 


DMA 即 直接 内 存 存 取 (Direct Memory Access) ,传送 的 数据 单位 是 数据 块 。 其 所 传送 
的 数据 从 设备 直接 送 入 内 存 或 者 相反 。DMA 仅 在 传送 一 个 或 多 个 数据 块 的 开始 和 结束 
时 , 才 需 CPU 干预 。DMA 控制 器 中 除了 状态 寄存 器 和 数据 寄存 器 外 ,还 需要 内 存 地 址 寄 
存 器 、 字 节 计 数 器 等 。 图 6-5 给 出 了 DMA 控制 方式 的 处 理 流程 。 

当 进 程 要 求 从 一 个 指定 的 设备 输入 数据 时 ,由 CPU 向 相应 设备 的 DMA 控制 器 发 送 一 
条 读 命令 ,同时 将 本 次 将 要 读 入 的 内 存 起 始 地 址 送 入 DMA 控制 器 的 内 存 地 址 寄存 器 ,要 读 
取 的 数据 字 节 数 送 入 DMA 控制 器 的 字 节 计数 器 。 另 外 ,还 将 控制 状态 寄存 器 中 的 中 断 允 
许 位 和 启动 位 置 1。 然 后 启动 DMA 控制 器 进行 数据 的 传送 。 而 当前 进程 将 转 入 阻塞 状 
态 ,等 待 数 据 传输 的 完成 ,由 调度 程序 调度 其 他 进程 执行 。 当 输入 设备 将 数据 送 入 DMA 控 
制 器 的 数据 寄存 器 后 ,由 设备 向 DMA 控制 器 发 送 一 个 请 求 信号 ,DMA 控制 器 接收 到 这 个 
信号 后 ,将 挪用 一 个 总 线 控制 周期 ,将 数据 从 DMA 控制 器 的 数据 寄存 器 中 送 入 指定 的 内 存 
单元 中 ,同时 , 字 节 计数 器 中 的 数 减 1, 如 此 反复 ,直到 字 节 计数 器 的 值 为 0, 表示 本 次 传送 数 














176。 ”操作 系统 原理 及 Linux 内 核 分 析 ( 第 2 版 ) 

























































人 下 
DMA 控 制 器 发 出 Start 命 令 
接收 Start 命 令 内 存 始 址 一 内 存 地 址 寄存 器 
传送 字 节 数 一 字 节 计 数 器 
中 断 允 许 位 与 启动 位 置 1 
启动 设备 准备 数据 1 
1 当前 进程 等 待 ， 调 度 
数据 送 入 数据 程序 调度 其 他 进程 
寄存 器 
1 
数据 寄存 器 的 被 调度 进程 执行 
内 容 送 入 内 存 
改变 字 节 计数 器 与 









接收 到 否 
中 断 信号 ? 


是 


内 存 地 址 寄存 器 的 
内 容 























转 中 断 处 理 程序 
发 中 断 信号 
停止 WO 操作 
(a) 外 设 处 理 流程 (b) CPU 处 理 流程 


图 6-5 DMA 控制 方式 的 处 理 流程 


据 完毕 。 同 时 ,DMA 控制 器 通过 中 断 线 发 出 中 断 请 求 ,CPU 检测 到 中 断 信号 后 ,调用 相应 
的 中 断 处 理 程 序 完成 善后 的 处 理工 作 。 

相反 , 当 进 程 要 求 向 一 个 指定 的 设备 输出 数据 时 ,由 CPU 向 相应 设备 的 DMA 控制 器 
发 送 一 条 写 命令 ,同时 将 本 次 将 要 输出 数据 的 内 存 起 始 地 址 送 入 DMA 控制 器 的 内 存 地 址 
寄存 器 ,要 写 出 的 数据 字 节 数 送 入 DMA 控制 器 的 字 节 计数 器 。 然 后 由 DMA 控制 器 控制 
数据 的 传送 ,直到 数据 传送 完成 ,最 后 由 CPU 执行 调用 相应 的 中 断 处 理 程序 完成 必要 的 处 
理工 作 。 

与 中 断 控制 方式 相 比 ,DMA 控制 方式 虽然 也 调用 了 中 断 处 理 程序 来 完成 数据 传输 的 
善后 工作 ,但 是 其 数据 的 传输 过 程 与 中 断 控制 方式 有 两 个 主要 的 区 别 。 

(1) 传送 同样 的 数据 ,中 断 处 理 次 数 不 同 。 中 断 控制 方式 是 在 数据 缓冲 器 满 后 发 出 中 
断 请 求 ,而 DMA 控制 方式 则 是 在 所 要 求 传 送 的 数据 全 部 完成 时 才 发 出 中 断 请 求 , 这 样 就 大 
大 减少 了 CPU 进行 中 断 处 理 的 次 数 。 

(2) 中 断 控制 方式 受 CPU 控制 ,而 DMA 控制 方式 直接 完成 与 内 存 的 数据 交换 ,不 受 
CPU 控制 。 中 断 控制 方式 的 数据 传送 是 在 中 断 处理 时 由 CPU 将 数据 传送 到 指定 的 存储 单 
元 中 ,每 次 传送 完成 时 ,内 存 地 址 的 修改 以 及 数据 是 否 传送 完成 等 信息 等 都 必须 由 CPU 去 
控制 。 而 DMA 控制 方式 在 传送 数据 之 前 必须 由 CPU 对 DMA 控制 器 编程 ,以 确定 传送 模 
式 、 内 存 地 址 、 传 送 字 节 等 参数 。 数 据 传送 过 程 不 经 过 CPU 的 控制 ,由 DMA 控制 器 控制 完 
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成 外 设 和 内 存 之 间 的 直接 数据 传送 。 传 送 完 毕 后 , 需 CPU 读 取 DMA 控制 器 的 状态 , 作 必 
要 的 结束 处 理 。 这 样 ,排除 了 因 并 行 操作 设备 过 多 时 CPU 来 不 及 处 理 或 因 速度 不 匹配 造 
成 的 数据 丢失 现象 。 

但 是 ,DMA 控制 方式 仍然 存在 下 列 缺 点 。 

(1) 对 于 大 量 的 数据 传送 , 仍 需要 CPU 控制 。DMA 控制 方式 中 ,CPU 每 发 出 一 条 
1/O 指令 ,只 能 读 一 个 连续 的 数据 块 ,而 当 需 要 一 次 读 多 个 不 连续 的 数据 块 时 就 需要 多 次 
中 断 。 

(2) 多 个 DMA 控制 器 同时 使 用 会 引起 内 存 地 址 的 冲突 ,使 得 控制 过 程 变 得 复杂 。 

(3) 需要 DMA 控制 器 硬件 支持 。 现 代 计算 机 系统 所 配置 的 外 设 越 来 越 多 ,同时 配置 
多 个 DMA 控制 器 会 增加 计算 机 的 成 本 。 


6.2.4 通道 控制 方式 


为 了 进一步 提高 系统 对 I/O 的 处 理 速度 ,减少 CPU 对 数据 传输 的 干预 ,在 大 型 的 计算 
机 系统 中 引入 了 一 种 特殊 的 硬件 设施 一 一 通道 。 


1. 通道 


通道 是 一 种 独立 于 处 理 机 ,专门 用 于 输入 输出 操作 控制 的 特殊 处 理 机 ,也 称 为 7O 处 
理 机 。 它 具有 执行 /O 指令 的 能 力 , 并 通过 执行 通道 程序 来 完成 内 存 和 外 设 之 间 的 数据 传 
送 。 与 一 般 的 处 理 机 相 比 , 它 具 有 如 下 的 特征 : 

(1) 有 自己 专门 的 通道 命令 ,用 于 与 控制 器 连接 的 设备 通信 ,控制 设备 与 内 存 之 间 的 数 
据 传输 。 通 道 命令 一 般 包 含 要 传输 的 数据 在 内 存 中 的 地 址 、 传 送 方向 ,数据 块 长 度 以 及 被 控 
制 的 WO 设备 的 地 址 信息 、 特 征 信息 等 。 

(2) 命令 类 型 单一 ,其 所 能 执行 的 命令 主要 局 限于 与 IO 操作 有 关 的 命令 。 通 道 没有 
自己 的 内 存 , 通 道 命令 构成 相应 的 通道 程序 放 在 主机 的 内 存 中 。 通 道 程序 在 进程 要 求 数据 
传输 时 由 系统 自动 生成 。 


2. 控制 过 程 


当 进 程 要 求 进行 数据 传输 时 ,首先 在 内 存 中 生成 相应 的 通道 程序 ,然后 执行 启动 命令 ， 
指明 I/O 操作 ,设备 号 和 对 应 的 通道 。 若 此 时 对 应 的 通道 可 用 , 则 启动 通道 成 功 。 这 时 当 
前 进程 进入 等 待 状态 ,CPU 可 转 去 执行 其 他 进程 。 当 通道 接收 到 启动 命令 后 ,独立 执行 存 
放 在 内 存 中 的 通道 程序 ,根据 通道 程序 命令 启动 对 应 的 控制 器 ,控制 完成 内 存 与 外 设 之 间 的 
数据 交换 。 当 1/O 完成 后 ,控制 器 通过 中 断 请 求 线 发 出 中 断 请 求 ,CPU 进行 结束 处 理 。 
图 6-6 给 出 了 通道 控制 方式 的 处 理 流程 。 


3. 通道 的 类 型 

按照 信息 交换 方式 的 不 同 ,通道 有 3 种 类 型 。 图 6-7 给 出 了 由 这 3 种 通道 组 成 的 数据 
传送 控制 结构 。 

(1) 字 节 多 路 通道 。 它 适用 于 连接 打印 机 、 终 端 等 低速 的 IO 设备 。 这 种 通道 连接 多 
个 子 通道 ,每 一 个 子 通道 连接 一 台 设 备 , 并 控制 该 设备 的 1/O 操作 。 这 些 子 通道 按时 间 片 
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用 户 1/O 请 求 


em 是。| 这 入 设备 
A 请 求 队列 


调用 通道 程序 




















了 
以 MO 命令 启动 通道 








执行 通道 程序 





CPU 进行 
a 工作 





了 
1/O 操 作 完 成 ， 发 出 中 断 请 求 


1 
CPU 响应 中 断 ， 结 束 处 理 




















6-6 通道 控制 方式 的 处 理 流程 
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图 6-7 3 种 通道 组 成 的 数据 传送 控制 结构 

分 时 方式 共享 主 通道 。 当 第 一 个 子 通道 控制 其 1/O 设备 完成 一 个 字 节 的 交换 后 , 便 立即 让 
出 主 通道 ,让 第 二 个 子 通 道 完成 数据 交换 ,以 此 类 推 。 

(2) 选择 通道 。 它 适用 于 连接 高 速 的 1/0 设备 ,如 磁盘 、 磁 带 等 ,每 次 传送 一 批 数 据 , 传 
送 速率 很 高 。 选 择 通道 只 有 一 个 分 配 型 子 通道 ( 即 这 个 通道 可 以 连接 多 个 设备 ,但 每 次 只 能 
把 子 通道 分 配给 一 台 设备 使 用 ) ,在 一 段 时 间 内 只 执行 一 道 通道 程序 ,控制 一 台 设 备 进行 数 
据 传输 。 一 旦 分 配给 某 台 设备 , 子 通道 被 它 独占 ,即使 出 现 空闲 ,也 不 允许 其 他 设备 使 用 该 
子 通道 ,直到 该 设备 传送 完毕 ,释放 该 通道 。 这 种 传送 方式 通道 利用 率 低 ,传输 速率 高 。 

(3) 数组 多 路 通道 。 这 种 通道 综合 了 字 节 多 路 通道 分 时 工作 和 选择 通道 传输 速率 高 的 
特点 。 它 具有 多 个 非 分 配 型 子 通道 ,每 个 子 通道 连接 一 台中 高 速 的 1/0 设备 ,因而 通道 所 
连接 的 设备 可 以 并 行 工作 ,每 台 设备 的 数据 传输 方式 是 成 组 的 。 
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4. 通道 控制 方式 与 DMA 控制 方式 的 区 别 


通道 控制 方式 与 DMA 控制 方式 有 以 下 几 个 区 别 : 

(1) 通道 连接 了 通道 设备 控制 器 ,控制 器 中 没有 字 节 计数 器 ,内存 地 址 寄存 器 ,有 命令 
执行 机 构 。 

(2) 通道 传送 数据 完全 由 通道 命令 来 控制 ,一 次 可 以 连续 传送 多 个 数据 块 。 

(3) DMA 控制 方式 只 和 一 个 设备 相连 ,一 个 通道 可 连接 并 控制 多 台 设 备 。 

通道 技术 通常 在 大 中 型 计算 机 系统 普遍 采用 ,由 于 大 部 分 数据 传输 由 通道 完成 ,IO 控 
制 器 的 作用 相对 较 小 。 对 无 通道 结构 的 小 型 与 微型 机 来 说 ,多 采用 由 系统 处 理 机 直接 控制 
设备 接口 和 设备 控制 器 的 方式 ,或 者 在 I/O 控制 器 上 使 用 专用 的 W/O 处 理 器 来 控制 设备 。 
随 着 计算 机 硬件 系统 和 部 件 的 发 展 , 带 有 自己 的 处 理 部 件 的 设备 控制 器 或 者 接口 卡 已 大 量 
出 现 ,这 些 内 骨 了 处 理 器 并 且 含有 固化 控制 程序 的 部 件 被 称 为 智能 控制 部 件 或 接口 。 虽 然 
这 些 IO 处 理 器 的 类 型 各 不 相同 ,但 整个 部 件 起 到 了 通道 的 作用 。 它 们 只 需要 接收 系统 处 
理 器 的 委托 和 激发 ,通过 这 些 部 件 中 的 固化 程序 完成 1/O 操作 ,与 系统 处 理 器 并 行 工作 。 


6.3 中 断 处 理 与 设备 驱动 程序 


从 前 面 几 节 可 知 , 当 用 户 进程 通过 系统 调用 请 求 /O 操作 后 ,将 由 操作 系统 的 逻辑 I/O 
系统 调用 对 应 设备 的 设备 驱动 程序 完成 设备 的 驱动 。 除 了 程序 直接 控制 外 ,无 论 是 中 断 控 
制 方式 .DMA 控制 方式 还 是 通道 控制 方式 ,都 是 在 I/O 设备 完成 VO 操作 后 ,设备 控制 器 
便 向 CPU 发 送 中 断 请 求 ,CPU 响应 后 便 转 向 中 断 处 理 程序 。 在 中 断 处 理 完成 后 ,再 由 设备 
驱动 程序 将 W/O 操作 完成 情况 反馈 给 上 层 调 用 者 。 

本 节 从 设备 管理 的 角度 讨论 中 断 处 理 与 设备 驱动 处 理 的 主要 策略 。 


6.3.1 中 断 处 理 过 程 


一 旦 CPU 响应 中 断 ,系统 就 转 入 中 断 处 理 程序 。 中 断 处 理 程序 的 处 理 过 程 主要 有 以 
下 几 个 步骤 。 


1. 保护 被 中 断 进程 的 CPU 环境 





为 了 在 中 断 处 理 结 束 后 能 使 进程 正确 地 返回 到 中 断 点 ,系统 必须 保存 当前 处 理 机 状态 
字 和 程序 计数 器 等 的 值 。 通 常 由 硬件 自动 将 处 理 机 状态 字 和 程序 计数 器 中 的 内 容 保 存在 中 
断 保留 区 ( 栈 ) 中 ,然后 把 被 中 断 进程 的 CPU 现场 信息 ( 即 包括 所 有 的 CPU 寄存 器 ,如 通用 
寄存 器 、 段 寄存 器 等 内 容 ) 都 压 人 栈 中 。 


2. 转 入 相应 的 设备 处 理 程 序 


由 处 理 机 对 各 个 中 断 源 进 行 测试 ,以 确定 引起 本 次 中 断 的 LO 设备 ,然后 将 相应 的 设 
备 中 断 处 理 程序 的 和 人口 地 址 装 和 人 程序 计数 器 中 ,使 处 理 机 转向 中 断 处 理 程序 。 
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3. 中 断 处 理 


不 同 的 设备 有 不 同 的 中 断 处理 程 序 。 该 程序 首先 从 设备 控制 器 中 读 出 设备 状态 ,以 判 
别 本 次 中 断 是 正常 完成 中 断 还 是 异常 结束 中 断 。 若 是 前 者 ,中 断 处 理 程序 便 做 结束 处 理 , 若 
还 有 命令 ,可 再 向 设备 控制 器 发 送 新 的 命令 ,进行 新 一 轮 的 数据 传送 ; 若是 后 者 , 则 根据 发 
生 异 常 的 原因 做 相应 的 处 理 。 


4. 恢复 被 中 断 进程 的 现场 


当中 断 处 理 完成 以 后 ,将 等 待 该 中 断 请 求 的 进程 唤醒 ,同时 将 保存 在 中 断 栈 中 的 被 中 断 
进程 的 现场 信息 取出 ,并 装 入 相应 的 寄存 器 中 ,其 中 包括 该 程序 下 一 次 要 执行 的 指令 的 地 
址 、 处 理 机 状态 字 以 及 各 通用 寄存 器 和 有 段 寄存 器 的 内 容 。 这 样 , 当 人 处 理 机 继续 执行 本 程序 
时 ,能 正确 地 返回 到 被 中 断 时 程序 的 状态 。 

除了 上 述 的 第 3 步 外 ,其 他 各 步骤 对 所 有 I/O 设备 都 是 相同 的 ,因而 某 种 操作 系统 , 例 
如 UNIX 系统 ,往往 把 这 些 共 同 的 部 分 集中 起 来 ,形成 中 断 总 控 程 序 。 每 当 要 进行 中 断 处 
理 时 ,都 要 首先 进入 中 断 总 控 程 序 。 而 对 于 第 3 步 , 则 对 不 同 设备 须 采用 不 同 的 设备 中 断 处 
理 程序 继续 执行 。 图 6-8 给 出 了 中 断 处 理 流程 。 
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图 6-8 中 断 处 理 流程 


6.3.2 设备 驱动 程序 


设备 驱动 程序 主要 是 指 在 请 求 1/O 的 进程 与 设备 控制 器 之 间 的 一 个 通信 和 转换 程序 。 
它 对 进程 的 I/O 请 求 进行 转换 后 ,发 送 一 条 启动 命令 ,传送 给 控制 器 ; 又 把 控制 器 中 所 有 记 
录 的 设备 状态 和 I/O 操作 完成 情况 及 时 地 反馈 给 请 求 1/O 的 进程 。 


1. 设备 驱动 程序 的 特点 
设备 驱动 程序 也 称 为 1/O 处 理 程序 ,是 一 种 低级 的 系统 例 程 , 它 向 上 与 高 级 W/O 操作 
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原 语 相对 应 ,向 下 与 1/O 硬件 设备 相对 应 ,完成 两 者 间 的 相互 通信 。 它 与 一 般 的 应 用 程序 
及 系统 程序 之 间 有 以 下 差异 : 

(1) 设备 驱动 程序 不 能 被 用 户 进程 直接 执行 ,只 能 通过 I/O 请 求 和 调用 方式 ,经 过 间接 
转换 和 映射 ,由 系统 执行 。 

(2) 设备 驱动 程序 与 设备 控制 器 和 I/O 设备 的 硬件 特性 紧密 相关 ,因而 对 不 同类 型 的 
设备 应 配置 不 同 的 设备 驱动 程序 。 系 统 往往 对 略 有 差异 的 一 类 设备 提供 一 个 通用 的 设备 驱 
动 程序 。 例 如 ,在 Microsoft Windows 操作 系统 中 ,为 CD-ROM 提供 了 一 个 通用 的 设备 驱 
动 程序 。 但 有 时 即使 是 同一 类 型 的 设备 ,由 于 其 生产 厂家 不 同 , 它 们 也 可 能 并 不 完全 兼容 ， 
此 时 也 须 为 它们 配置 不 同 的 设备 驱动 程序 。 

(3) 设备 驱动 程序 与 MO 设备 所 采用 的 1/O 控制 方式 紧密 相关 。 常 用 的 IO 控制 方式 
是 中 断 控制 和 DMA 控制 ,这 两 种 方式 的 设备 驱动 程序 明显 不 同 , 因 为 后 者 应 按 数组 方式 启 
动 设备 及 进行 中 断 处 理 。 

(4) 由 于 设备 驱动 程序 与 硬件 紧密 相关 ,因而 其 中 的 一 部 分 必须 用 汇编 语言 书写 ,针对 
具体 的 1/O 设备 控制 器 进行 控制 编码 或 微 程序 操作 。 目 前 很 多 设备 驱动 程序 的 基本 部 分 
已 经 固化 在 ROM 中 。 

(5) 不 同 的 操作 系统 对 设备 驱动 程序 的 结构 要 求 不 同 。 一 般 来 说 ,在 操作 系统 中 的 相 
关 文 档 中 ,都 有 对 设备 驱动 程序 结构 要 求 的 描述 。 每 个 设备 生产 厂商 和 软件 开发 商都 必须 
按照 设备 驱动 程序 的 标准 结构 编写 独立 的 设备 驱动 程序 , 当 系 统 需 要 时 ,再 将 它 安装 配置 到 
系统 中 。 


2. 设备 驱动 程序 的 处 理 过 程 


设备 驱动 程序 的 结构 因 系 统 不 同 而 异 ,一 般 情况 下 它 应 包含 两 部 分 : 能 够 驱动 /O 设 
备 工作 的 设备 驱动 程序 和 处 理 1/O 完成 后 的 工作 的 设备 中 断 处 理 程序 。 

设备 驱动 程序 的 处 理 过 程 主要 有 以 下 步骤 ， 

(1) 将 抽象 要 求 转换 为 具体 要 求 。 通 常 在 每 个 设备 控制 器 中 都 含有 若干 个 寄存 器 , 它 
们 分 别 用 于 和 暂 存 命令 、 数 据 和 参数 等 。 用 户 及 上 层 软 件 对 设备 控制 器 的 具体 情况 毫 无 了 解 ， 
因而 只 能 向 它 发 出 抽象 的 要 求 ( 命 令 ) ,但 这 些 命令 无 法 传送 给 设备 控制 器 。 因 此 ,就 需要 将 
这 些 抽象 要 求 转换 为 具体 要 求 。 例 如 ,将 抽象 要 求 中 的 盘 块 号 转换 为 磁盘 的 盘面 、 磁 道 号 及 
扇 区 。 这 一 转换 工作 只 能 由 设备 驱动 程序 来 完成 ,因为 在 操作 系统 中 只 有 设备 驱动 程序 才 
同时 了 解 抽象 要 求 和 设备 控制 器 中 的 寄存 器 情况 ; 也 只 有 它 才 知道 命令 .数据 和 参数 应 分 
别 送 往 哪个 寄存 器 。 

(2) 检查 1/O 请 求 的 合法 性 。 任 何 设 备 都 只 能 完成 一 组 特定 的 功能 , 若 该 设备 不 支持 
这 次 的 I/O 请 求 , 则 认为 这 次 I/O 请 求 非法 。 例 如 ,用 户 试 图 请 求 从 打印 机 输入 数据 ,显然 
系统 应 予以 拒绝 。 此 外 ,还 有 些 设 备 , 如 磁盘 和 终端 ,虽然 都 是 既 可 读 又 可 写 的 ,但 若 在 打开 
这 些 设备 时 规定 的 是 读 , 则 用 户 的 写 请 求 必然 被 拒绝 。 

(3) 读 出 和 检查 设备 的 状态 。 在 启动 某 个 设备 进行 1/O 操作 时 ,其 前 提 条 件 应 是 该 设 
备 正 处 于 空闲 状态 。 因 此 在 启动 设备 之 前 ,要 从 设备 控制 器 的 状态 寄存 器 中 读 出 设备 的 状 
态 。 例 如 ,为 了 向 某 设备 写 人 数据 ,应 先 检查 该 设备 是 否 处 于 接收 就 绪 状 态 。 仅 当 它 处 于 接 
收 就 绪 状 态 时 ,才能 启动 其 设备 控制 器 ,否则 只 能 等 待 。 
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(4) 传送 必要 的 参数 。 有 许多 设备 ,特别 是 块 设备 , 除 必须 向 其 控制 器 发 出 启动 命令 
外 ,还 要 传送 必要 的 参数 。 例 如 ,在 启动 磁盘 进行 读 / 写 之 前 ,应 先 将 本 次 要 传送 的 字 节 数 和 
数据 应 到 达 的 主 存 始 址 送 入 设备 控制 器 的 相应 寄存 器 中 。 

(5) 工作 方式 的 设置 。 有 些 设备 具有 多 种 工作 方式 ,典型 情况 是 利用 RS-232 接口 进行 
异步 通信 。 在 启动 该 接口 之 前 ,应 先 按 通 信 规 程 设 定 下 述 参数 : 波 特 率 、 奇 偶 校 验方 式 、 停 
止 位 数目 及 数据 字 节 长 度 等 。 

(6) 启动 1O 设备 。 在 完成 上 述 各 项 准备 工作 后 ,设备 驱动 程序 可 以 向 设备 控制 器 中 
的 命令 寄存 器 传送 相应 的 控制 命令 。 

(7) 信息 返回 。 设 备 驱动 程序 发 出 I/O 命令 后 ,其 本 次 的 1/O 操作 是 在 设备 控制 器 的 
控制 下 进行 的 。1/O 操作 完成 后 ,设备 驱动 程序 必须 检查 本 次 1/O 操作 中 是 否 发 生 了 错误 ， 
并 向 上 层 软件 报告 ,最 终 向 调用 者 报告 本 次 1/O 的 执行 情况 ,并 把 因 等 待 此 操作 完成 而 阻 

通常 ,I/O 操作 要 完成 的 工作 较 多 ,需要 一 定 的 时 间 , 如 读 / 写 一 个 盘 块 中 的 数据 ,此 时 
设备 驱动 (程序 ) 进 程 把 自己 阻塞 起 来 ,直到 中 断 到 来 时 才 被 唤醒 。 但 在 特殊 情况 下 ,操作 可 
以 毫 不 拖延 地 完成 ,所 以 设备 驱动 程序 无 须 阻 塞 。 例 如 ,滚动 某 些 终端 的 屏幕 只 需 几 个 字 节 
写 入 设备 控制 器 寄存 器 即 可 ,整个 操作 可 以 在 几 微 秒 中 完成 。 在 操作 完成 后 ,不 管 哪 种 做 法 
都 必须 检查 错误 。 只 不 过 对 于 阻塞 情况 ,将 在 中 断 处 理 中 检查 ; 对 于 不 阻塞 的 情况 ,在 此 处 
马上 检查 。 

设备 驱动 程序 在 完成 上 述 工作 后 ,如 果 还 有 其 他 的 1/O 请 求 , 则 启动 下 一 个 W/O 请 求 ; 
如 果 没 有 新 的 IO 请 求 , 则 该 设备 驱动 程序 阻塞 ,等 待 下 一 个 请 求 的 到 来 。 


6.4 缓冲 技术 


缓冲 区 管理 是 巡 辑 IO 系统 的 重要 功能 之 一 。 它 主要 为 进行 数据 传输 的 1/O 设备 负 
责 缓 冲 区 的 申请 与 释放 ,控制 I/O 缓冲 与 内 存 之 间 的 数据 传输 。 


6.4.1 引入 缓冲 技术 的 原因 


由 于 处 理 机 和 外 设 速度 不 匹配 以 及 系统 各 部 分 的 负荷 也 常常 不 均衡 ,致使 处 理 机 和 外 
设 的 并 行程 度 以 及 外 设 与 外 设 之 间 的 并 行程 度 受 到 影响 。 

先 用 一 个 简单 例子 说 明 处 理 机 和 外 设 的 工作 情况 。 假 设 在 一 段 时 间 内 ,系统 中 只 有 一 
个 用 户 进程 正在 使 用 行 式 打印 机 。 其 工作 过 程 如 下 : 

(1) 计算 并 产生 一 行 需 打 印 的 信息 ,它们 存放 在 字符 型 数组 lineLLENGTHJ] 中 。 这 有 段 
时 间 用 T. 表 示 。 

(2) 要 求 系统 将 line 数组 中 的 信息 送 到 行 式 打印 机 打印 。 打 印 所 需 时 间 表 示 为 Te 。 

步骤 (1) (2) 可 以 反复 多 次 。 如 图 6-9(a) 所 示 , 各 次 循环 中 ,T. 可 能 不 同 ,分 别 表示 为 
Tu,Te,…。 打 印 机 打印 一 行 的 时 间 大 致 相等 ,都 用 Ti 表示 。 图 中 实 线 部 分 表示 进程 正在 
处 理 机 上 和 运行 或 打印 机 正在 进行 打印 操作 ; 虚线 部 分 表示 该 进程 主动 放弃 处 理 机 ,处 于 睡 
眠 等 待 状态 ,或 者 打印 机 处 于 空闲 状态 。 从 图 中 可 以 看 出 ,进程 每 次 将 要 打印 的 数据 送 入 数 
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组 后 ,必须 转 和 等待 状 态 ,等 待 打印 机 打印 完成 。 同 时 打印 机 每 打印 完 一 行 信息 ,需要 发 生 
一 次 中 断 , 导 致 处 理 机 调度 操作 比较 频繁 ,因此 也 就 增加 了 系统 开销 。 打 印 机 的 忙 闲 程度 也 
很 不 均匀 ,不 能 充分 实施 并 行 操作 。 另 外 , 当 行 式 打印 机 工作 时 ,line 数组 所 在 的 数据 段 也 
驻 留 在 内 存 中 ,降低 了 内 存 的 使 用 效率 。 

解决 上 述 问题 的 一 种 常用 技术 是 设置 一 定数 量 的 缓冲 存储 区 。 例 如 ,在 系统 中 为 行 式 
打印 机 设置 一 个 缓冲 存储 区 buffer[LLENGTH]。 于 是 ,进程 使 用 行 式 打印 机 的 过 程 变 成 ， 

(1) 计算 并 产生 一 行 需 打印 的 信息 ,它们 存放 在 lineLLENGTHJ] 中 。 

(2) 系统 将 line 数组 中 的 信息 先 传送 到 buffer 中 ,这 一 工作 所 需 时 间 记 为 Te, 。 

(3) 命令 行 式 打印 机 将 buffer 中 的 内 容 打 印 出 来 ,时 间 为 Te 。 

在 这 种 情况 下 ,进程 和 行 式 打 印 机 的 工作 情况 如 图 6-9(b) 所 示 。 从 图 中 可 以 看 出 ,如 
果 工大 于 或 等 于 Ti ,那么 进程 就 可 以 连续 运行 ,不 必 主 动 放弃 处 理 机 。 男 外 ,在 需要 放弃 
处 理 机 时 ,由 于 打印 数据 已 缓存 在 buffer 中 ,所 以 进程 有 关 段 不 必 保 存在 内 存 中 。 但 是 如 
果 工 . 远 小 于 Te 那么 额外 的 进程 调度 还 是 不 可 避免 的 ,系统 性 能 的 进一步 提高 会 受到 
限制 。 
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图 6-9 缓冲 引入 示例 


为 了 进一步 提高 行 式 打印 机 的 利用 率 并 减少 进程 调度 及 中 断 次 数 ,可 以 继续 增加 缓冲 
存储 区 数 。 图 6-9(c) 是 系统 为 行 式 打印 机 设置 了 两 个 缓冲 存储 区 时 的 工作 情况 。 从 中 可 以 
看 出 ,只 要 进程 在 一 段 时 间 内 连续 产生 的 需要 打印 的 信息 少 于 缓存 容量 与 打印 机 在 这 段 时 
间 内 能 够 输出 的 信息 量 之 和 ,那么 进程 就 不 必 主 动 放弃 处 理 机 ,打印 机 也 能 以 正常 速度 连续 
工作 。 

系统 的 实际 工作 情况 比 上 面 的 例子 要 复杂 得 多 。 系 统 中 通常 有 多 个 进程 并 发 运行 , 它 
们 或 共享 或 各 独占 一 个 或 几 个 外 部 设备 ,即使 使 用 DMA 控制 方式 或 通道 控制 方式 控制 数 
据 传 送 时 ,如 果 不 用 专用 的 缓冲 区 来 存放 数据 ,也 会 因为 要 求 数据 的 进程 所 拥有 的 内 存 区 不 
够 或 存放 数据 的 内 存 始 址 计算 困难 等 原因 而 造成 某 个 进程 长 期 占用 通道 或 DMA 控制 器 及 
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设备 ,从 而 产生 所 谓 的 瓶颈 问题 。 

因此 ,为 了 解决 中 央 处 理 机 和 外 部 设备 的 速度 不 匹配 和 负荷 不 均衡 问题 ,减少 处 理 调度 
及 中 断 次 数 ,解决 DMA 控制 方式 或 通道 控制 方式 的 瓶颈 问题 ,提高 各 种 设备 的 工作 效率 ， 
增加 系统 中 各 部 分 的 并 行 工 作 速 度 , 在 设备 管理 中 引入 了 缓冲 技术 。 

需要 指出 的 是 ,缓冲 技术 是 以 空间 换取 时 间 ,而 且 它 只 能 在 设备 使 用 不 均衡 时 起 到 
平滑 作用 。 如 果 在 相当 长 的 一 段 时 间 内 ,进程 提出 的 输入 输出 要 求 超出 了 相应 设备 不 间 
断 工 作 所 能 完成 的 总 量 , 那 么 当 缓冲 已 全 部 存放 了 1/O 信息 后 ,多 缓冲 的 作用 也 就 基本 
消失 了 。 


6.4.2 缓冲 的 种 类 


根据 I/O 控制 方式 ,缓冲 的 设置 有 两 种 方式 : 

(1) 硬 缓冲 。 采 用 专用 的 硬件 缓冲 器 ,例如 1/O 控制 器 中 的 数据 缓冲 寄存 器 。 

(2) 软 缓冲 。 在 内 存 中 划 出 一 个 专用 的 区 域 ,专门 用 来 存放 输入 输出 数据 。 在 此 ,根据 
系统 设置 的 缓冲 器 的 个 数 ,可 把 缓冲 区 分 为 以 下 3 种 : 

O@D 单 缓冲 。 系 统 在 设备 和 处 理 机 之 间 设 置 一 个 缓冲 区 ,图 6-10 为 其 工作 示意 图 。 设 
备 和 处 理 机 交换 数据 时 , 先 把 被 交换 数据 写 入 缓冲 区 ,然后 ,由 设备 或 处 理 机 从 缓冲 区 取 走 
数据 。 因 为 单 缓冲 区 只 能 被 串 行 访问 ,所 以 进程 和 设备 之 间 可 能 会 出 现 等 待 。 假 定 从 磁盘 
把 一 块 数据 输入 到 缓冲 的 时 间 为 工 ,操作 系统 将 缓冲 区 中 的 数据 传送 到 用 户 区 的 时 间 为 
M, 而 CPU 对 这 一 数据 处 理 的 时 间 为 C。 由 于 工 和 C 是 可 以 并 行 的 , 当 T>C 时 ,对 每 一 块 
数据 处 理 的 时 间 为 T 十 M; 反之 则 为 C 十 M。 因 此 , 单 缓冲 区 并 不 能 明显 地 提高 设备 与 处 理 
机 之 间 的 并 行 度 。 
用 户 进程 
处 理 (C) 


传送 (M) = 输入 (7 


图 6-10 单 缓冲 工作 示意 图 


@ 双 缓 冲 。 系 统 在 设备 和 处 理 机 之 间 设 置 两 个 缓冲 区 ,其 工作 过 程 如 图 6-11 所 示 。 
当 设备 输入 时 ,可 将 数据 送 入 第 一 个 缓冲 区 ,可 不 必 等 待 处 理 机 将 数据 取 走 , 便 可 接着 将 第 
二 批 数据 送 入 第 二 个 缓冲 区 。 双 缓冲 时 ,系统 处 理 一 块 数据 的 时 间 可 以 粗略 地 认为 是 
MAX(CC,T)。 显 然 ,C> 工 时 , 双 缓 冲 可 使 设备 连续 工作 ; C= 本 时 ,可 以 让 CPU 不 必 等 待 
设备 的 输入 。 但 是 , 当 输 入 设备 的 工作 速度 与 CPU 工作 速度 相差 较 远 时 , 双 缓 冲 并 不 能 很 
好 地 解决 问题 。 














用 户 进程 一 一 


缓冲 区 1 
工作 区 AN 一 IO 设备 
组 站 区 | 


二 









































图 6-11 双 缓冲 工作 示意 图 
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@ 缓冲 池 。 内 存 中 多 个 大 小 相等 的 缓冲 区 连接 起 来 ,就 组 成 了 一 个 公用 缓冲 池 。 缓 冲 
池 由 系统 统一 管理 。 设 备 和 处 理 机 交换 数据 时 ,系统 将 为 之 分 配 多 个 缓冲 区 , 当 数 据 传输 完 
成 ,这 些 缓冲 区 将 被 回收 。 


6.4.3 缓冲 池 的 管理 


1. 缓冲 区 结构 


为 了 便于 管理 ,通常 一 个 缓冲 区 由 两 部 分 组 成 : 一 部 分 是 用 来 标识 该 缓冲 区 和 用 于 管 
理 的 缓冲 区 首部 , 另 一 部 分 是 用 于 存放 数据 的 缓冲 体 。 对 缓冲 池 
的 管理 是 通过 对 每 一 缓冲 区 的 缓冲 首部 进行 操作 实现 的 。 

缓冲 区 的 首部 如 图 6-12 所 示 , 它 包 括 缓冲 区 号 、 逮 辑 设备 号 、 
块 设备 上 的 数据 块 号 ,传输 字 节 数 . 互 斥 标志 位 及 缓冲 队列 的 链接 
指针 等 。 


2. 缓冲 队列 


缓冲 池 中 的 所 有 缓冲 区 通过 首部 链接 在 一 起 ,系统 把 各 缓冲 。 图 6-12 缓冲 区 首部 
区 按 其 使 用 的 状况 构成 3 种 缓冲 队列 : 

(1) 空 缓冲 队列 emq。 系 统 初 启 时 ,缓冲 池 中 所 有 的 缓冲 区 都 处 于 空闲 队列 。 

(2) 输入 缓冲 队列 inq, 即 所 有 装 满 输入 数据 的 缓冲 区 组 成 的 队列 。 

(3) 输出 缓冲 队列 outq, 即 所 有 装 满 输出 数据 的 缓冲 区 组 成 的 队列 。 


缓冲 区 号 








3. 4 种 工作 缓冲 区 


除了 上 述 的 3 种 缓冲 区 队列 ,系统 中 还 有 4 种 工作 缓冲 区 。 进 程 从 3 种 队列 申请 或 取 
出 缓冲 区 ,并 用 得 到 的 缓冲 区 进行 存 数 、 取 数 操作 ,在 存 取 数 操作 结束 后 ,再 将 缓冲 区 插入 到 
相应 的 队列 中 ,这 些 缓冲 区 被 称 为 工作 缓冲 区 。 图 6-13 给 出 了 分 别称 为 收容 输入 缓冲 区 
hin、 提 取 输 入 缓冲 区 sin ,收容 输出 缓冲 区 hout、 提 取 输 出 缓冲 区 sout 的 4 种 工作 缓冲 区 ， 
它们 分 别 对 应 缓冲 区 的 4 种 工作 方式 , 即 收容 输入 .提取 输入 ,收容 输出 和 提取 输出 。 
缓冲 池 
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图 6-13 缓冲 区 的 4 种 工作 方式 


4. 缓冲 区 的 工作 过 程 


缓冲 区 的 操作 由 以 下 几 个 过 程 组 成 : 
(1) 从 3 种 缓冲 区 队列 中 按 一 定 的 选取 规则 取出 一 个 缓冲 区 的 过 程 take_buf (type， 
number) 。 


(2) 把 缓冲 区 按 一 定 的 选取 规则 插入 相应 的 缓冲 区 队列 的 过 程 add_buf (type， 


操作 系统 原理 及 Li nux 内 核 分 析 (第 2 版 ) 


number) 。 
(3) 供 进 程 申 请 缓冲 区 的 过 程 get_buf(type,number) 。 
(4) 供 进 程 将 缓冲 区 放 入 相应 的 缓冲 区 队列 的 过 程 put_buf(type,number) 。 
其 中 ,参数 type 表示 缓冲 区 队列 类 型 , number 为 缓冲 区 号 。 过 程 take_buf(type， 
number) 和 过 程 add_buf(type,number) 的 操作 与 数据 结构 中 学 习 过 的 队列 操作 过 程 类 似 ， 
在 此 不 再 丙 述 。 
下 面 给 出 get_buf(type,number) 和 put_buf(type,number) 的 过 程 描述 。 
设 互 斥 信号 量 SCtype) 用 于 缓冲 队列 的 互 斥 操作 ,同步 信号 量 RS(type) 表 示 每 类 缓冲 
区 队列 的 数量 。 
get_buf(type, number) 
{ 
P(RS(type) ) 7 
P(S(type) ) ; 
Pointer of buffer(number) = take_buf(type,number); 
VCS(type) ) 
} 
put_buf( type, number) 
{ 
P(S(type)); 
add_buf (type, number ) ; 
V(S(type)); 
V(RS(type)); 

} 


使 用 过 程 get_buf(type,number) 和 put_buf(type,number) ,缓冲 池 的 工作 过 程 如 下 : 

(1) 收容 输入 过 程 。 当 进程 需要 从 输入 设备 输入 数据 时 ,输入 进程 调用 get_buf(emq， 
number) 从 空 缓冲 队列 emq 中 取出 一 个 缓冲 区 号 为 number 的 空白 缓冲 区 ,将 其 作为 收容 
输入 缓冲 区 hin, 当 hin 中 装 满 了 由 输入 设备 输入 的 数据 之 后 ,系统 调用 put_buf(inq,hin)， 
将 该 缓冲 区 插入 输入 缓冲 队列 inq 中。 

(2) 提取 输入 过 程 。 当 用 户 进程 需要 从 输入 缓冲 区 队列 inq 中 提取 数据 时 , 则 调用 过 
程 get_buf(inq,number) 从 输入 缓冲 队列 中 取出 一 个 装 满 输入 数据 的 缓冲 区 number 作为 
提取 输入 缓冲 区 sin, 当 CPU 从 中 提取 完 所 需 数据 之 后 ,系统 调用 put_buf(emq, sin) ,将 该 
绥 冲 区 释放 并 插入 到 空 缓冲 队列 emq 中 。 

(3) 收容 输出 过 程 。 当 进程 需要 输出 数据 时 ,输出 进程 经 过 缓冲 管理 程序 调用 get_buf 
(emq,number) ,从 空 缓冲 区 队列 中 取出 一 个 空 缓冲 区 number 作为 收容 输出 缓冲 区 hout， 
待 hout 中 装 满 输出 数据 之 后 ,系统 再 调用 put_buf(outq,hout) 将 该 缓冲 区 插入 输出 缓冲 队 
列 outq。 

(4) 提取 输出 过 程 。 当 需要 从 输出 缓冲 队列 outq 中 提取 数据 时 , 则 调用 get_buf(outq， 
number) 从 输出 缓冲 队列 中 取出 装 满 输出 数据 的 缓冲 区 number, 将 其 作为 提取 输出 缓冲 区 
sout。 当 sout 中 的 数据 输出 完毕 时 ,系统 调用 put_buf(emq,sout) 将 该 缓冲 区 插入 空 缓冲 
队列 。 
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6.5 设备 分 配 


在 计算 机 系统 中 ,设备 控制 器 和 通道 等 资源 是 有 限 的 ,并 不 是 每 个 进程 随时 都 可 以 得 到 
这 些 资源 , 它 首先 要 向 设备 管理 程序 提出 申请 ,然后 由 设备 管理 程序 按照 一 定 的 分 配 算法 给 
进程 分 配 必要 的 资源 。 如 果 进 程 的 申请 没有 成 功 ,就 要 在 资源 的 等 待 队 列 中 排队 等 待 ,直到 
获得 所 需 的 资源 为 止 。 

下 面 就 来 讨论 与 设备 分 配 相关 的 数据 结构 ,以 及 设备 分 配 的 一 些 原则 与 策略 。 


6.5.1 设备 分 配 中 的 数据 结构 


任何 算法 的 实现 都 离 不 开 数据 结构 的 支持 ,在 设备 分 配 算法 中 也 不 例外 。 为 了 记录 系 
统 内 所 有 设备 的 情况 ,以便 对 它们 进行 有 效 的 管理 ,引入 了 一 些 表 ,如 为 每 个 设备 (通道 、 控 
制 咒 ) 配 置 的 设备 (通道 .控制 器 ) 控 制 表 等 。 由 于 系统 的 管理 .分 配方 式 不 同 ,实际 采用 的 表 
结构 也 不 相同 。 例 如 ,通道 控制 表 就 只 有 在 采用 通道 控制 方式 的 系统 中 才 会 出 现 。 

在 设备 分 配 算法 的 实现 中 , 常 采 用 的 数据 结构 主要 包含 4 张 表 , 即 系统 设备 表 (System 
Device Table,SDT) ,设备 控制 表 (Device Control Table,DCT) 、 控制 器 控制 表 (Controler 
Control Table,COCT) 和 通道 控制 表 (Channel Control Table,CHCT) ,如 图 6-14 所 示 。 这 
4 张 表 在 分 配 算法 中 形成 了 一 个 有 机 整体 ,有 效 地 记录 了 外 设 资 源 在 系统 中 的 情况 。 设 备 
的 每 一 次 分 配 调用 都 与 这 4 张 表 有 关 。 


SDT 


设备 类 型 
区 和 设备 的 进程 


a i 
9 进程 
| :| 


DCT COCT CHCT 











设备 类 型 控制 器 标识 通道 标识 


通道 忙 / 闲 标记 


控制 器 忙 / 闲 标记 
设备 从/ 用 标记 
控制 器 等 待 队列 首 指针 





通道 等 待 队列 首 指针 
通道 等 待 队列 尾 指针 








设备 等 待 队列 首 指针 :4 待 队列 尾 指针 
设备 等 待 队 列 尾 指针 : 





图 6-14 设备 分 配 算法 中 的 4 张 表 的 表 项 内 容 


1. 系统 设备 表 (SDT) 
在 SDT 中 ,每 个 接 入 系统 中 的 外 围 设备 都 占有 一 个 表 项 ,记录 该 设备 的 名 称 、 类 型 . 标 


188 


vt 


操作 系统 原理 及 Linux 内 核 分 析 (第 2 版 ) 


识 、 获 得 设备 的 进程 .DCT 指针 (设备 控制 表 的 人 口 地 址 ) 及 设备 驱动 程序 人 口 地 址 等 相关 
的 信息 。SDT 在 整个 系统 中 只 有 一 张 ,全 面 反 映 了 系统 中 的 外 设 资源 的 类 型 .数量 ,占用 情 
况 等 。 

通过 SDT 可 以 反映 出 系统 中 设备 的 使 用 状态 , 即 系统 中 有 多 少 设备 是 空闲 的 ,有 多 少 
设备 已 被 分 配给 哪些 进程 。 


2. 设备 控制 表 (DCT) 


系统 中 的 每 台 设备 都 有 一 张 设备 控制 表 , 用 于 记录 设备 情况 ,在 DCT 中 充分 体现 出 了 
该 设备 各 方面 的 特征 ,设备 控制 表 中 有 设备 类 型 .设备 标识 、 设 备 忙 / 闲 标记 ,与 该 设备 相连 
的 COCT 指针 以 及 等 待 本 设备 进程 队列 的 首尾 指针 。 


3. 控制 器 控制 表 (COCT) 


每 个 设备 控制 器 都 有 一 张 控制 器 控制 表 , 用 于 记录 该 控制 器 的 使 用 情况 及 与 该 控制 器 
相连 的 通道 的 情况 ,具体 包括 该 设备 控制 器 标识 , 忙 / 闲 标记 .CHCT 指针 、 等 待 该 设备 控制 
器 的 进程 队列 首尾 指针 等 。 


4. 通道 控制 表 (CHCT) 


该 表 只 在 使 用 通道 控制 方式 的 系统 中 存在 。CHCT 反映 了 通道 的 使 用 情况 ,系统 中 的 
每 个 通道 都 有 一 张 CHCT。CHCT 包括 通道 标识 、 通 道 忙 / 闲 标 记 以 及 等 待 获 得 该 通道 的 
进程 等 待 队列 的 首尾 指针 。 

设备 (通道 ,控制 器 ) 等 待 队 列 也 是 与 设备 分 配 有 关 的 数据 结构 ,由 等 待 分 配 资源 的 进程 
控制 块 组 成 ,其 组 织 方式 由 分 配 策略 决定 ,如 先 来 先 服务 的 顺序 ,也 可 以 按照 优先 级 顺序 。 

在 操作 系统 引导 过 程 中 ,结合 系统 资源 的 配置 情况 ,将 各 个 1/O 设备 对 应 的 参数 填 人 
表 中 的 每 一 个 表 项 ,如 果 是 空闲 表 项 ,可 以 设置 空闲 标志 。 这 些 表 的 初始 化 一 般 在 操作 系统 
的 初始 化 过 程 中 完成 。 随 着 设备 的 分 配 和 释放 ,这 些 值 也 会 发 生变 化 。 


6.5.2 设备 分 配 的 原则 


设备 分 配 的 总 原则 是 , 既 要 充分 发 挥 设备 的 使 用 效率 ,又 要 避免 不 合理 的 分 配方 式 造成 
的 死 锁 系统 工作 北 乱 等 现象 ,使 用 户 在 多 辑 层 面 上 能 够 合理 ,方便 地 使 用 设备 。 设 备 分 配 
时 ,主要 应 考虑 下 面 几 个 因素 。 


1. 设备 的 特性 


设备 的 特性 是 设备 本 身 固有 的 属性 ,一般 分 为 独占 设备 .共享 设备 和 虚拟 设备 等 ,对 不 
同属 性 设备 的 分 配方 式 是 不 同 的 。 

1) 独占 设备 的 分 配 

独占 设备 每 次 只 能 分 配给 一 个 进程 使 用 ,这 种 使 用 特性 隐 含 着 死 锁 的 必要 条 件 , 所 以 在 
考虑 独占 设备 的 分 配 时 ,一 定 要 结合 有 关 防 止 和 避免 死 锁 的 安全 算法 。 

2) 共享 设备 的 分 配 

共享 设备 是 可 由 若干 个 进程 同时 使 用 的 设备 ,多 数 是 后 援 存储 设备 ,例如 磁盘 ,用 户 甲 
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读 自己 的 文件 ,用 户 乙 写 自 己 的 文件 ,用 户 丙 访 问 数据 库 文件 ,等 等 。 这 些 文件 都 存放 在 一 
个 磁盘 上 ,所 以 各 用 户 的 进程 共享 一 个 磁盘 设备 。 对 于 共享 设备 的 分 配 要 考虑 两 个 方面 : 
其 一 是 后 援 存储 设备 空间 的 分 配 ,其 二 是 对 该 空间 访问 权 的 分 配 。 后 援 存储 设备 与 文件 系 
统 有 密切 关系 ,其 空间 分 配 由 文件 系统 负责 ,在 此 不 再 袭 述 。 访 问 权 分 配 涉及 谁 ( 哪 个 进程 
或 用 户 ) 具 有 对 该 共享 设备 的 读 写 控制 权 。 这 时 ,将 整个 设备 作为 一 个 整体 或 独 享 设备 看 
待 , 按 独 享 设备 进行 分 配 ,其 分 配 算法 有 自身 的 特点 ,不 能 与 独 享 设备 完全 等 同 。 例 如 ,磁盘 
空间 由 若干 盘 区 组 成 ,每 个 盘 区 独立 编 址 ,逻辑 上 可 以 看 成 一 组 独 享 设备 ,每 个 进程 可 以 独 
享 其 中 的 一 个 或 几 个 盘 区 ,这 就 是 空间 分 配 。 而 具体 对 磁盘 操作 时 ,整个 磁盘 是 一 个 独 享 设 
备 ,因为 一 次 只 能 允许 一 个 进程 进行 读 写 ,这 是 访问 权 分 配 。 在 设备 管理 中 ,关心 的 是 后 者 。 

3) 虚拟 设备 分 配 

一 台 物 理 设 备 在 采用 虚拟 技术 后 可 变 成 多 台 逮 辑 上 的 虚拟 设备 ,因而 ,可 以 将 它 同 时 分 
配给 多 个 进程 使 用 。 


2. 安全 性 


从 安全 性 方面 考虑 ,设备 分 配 有 安全 分 配方 式 和 不 安全 分 配方 式 两 种 。 在 安全 分 配方 
式 中 ,每 当 进程 发 出 I/O 请 求 后 就 进入 阻塞 状态 ,直到 其 1/O 操作 全 部 完成 时 才 被 唤醒 。 
采用 这 种 分 配方 式 时 ,进程 一 旦 获得 某 种 设备 后 便 阻塞 ,使 该 进程 不 可 能 再 请 求 任何 资源 。 
因此 ,这 种 方式 排除 了 死 锁 的 “请 求 和 保持 ”的 必要 条 件 , 因 而 是 安全 的 ,但 是 进程 进展 缓慢 ， 
效率 比较 低 。 而 在 不 安全 分 配方 式 中 ,进程 发 出 1/O 请 求 后 继续 运行 ,如 果 需 要 ,还 可 以 发 
出 其 他 的 MO 请 求 , 申 请 到 的 设备 一 旦 使 用 完 就 立即 释放 , 仅 当 请 求 的 设备 已 经 被 其 他 进 
程 占 用 的 时 候 才 进 入 阻塞 状态 。 这 种 方式 提高 了 运行 效率 ,但 是 存在 死 锁 的 可 能 ,因此 设备 
分 配 程序 中 应 该 增加 预测 死 锁 的 安全 性 设计 ,在 一 定 程度 上 增加 了 程序 的 复杂 性 。 


3. 设备 分 配 策略 


与 进程 的 调度 相似 ,设备 的 分 配 也 需要 一 定 的 策略 ,通常 采用 先 来 先 服务 (FCFS) 和 高 
优先 级 优先 等 策略 。 先 来 先 服务 就 是 当 多 个 进程 同时 对 一 个 设备 提出 1/O 请 求 时 ,系统 按 
照 进 程 提出 请 求 的 先后 次 序 把 它们 排 成 一 个 设备 请 求 队列 ,并 且 总 是 把 设备 首先 分 配给 排 
在 队 首 的 进程 使 用 。 高 优先 级 优先 就 是 给 每 个 进程 提出 的 1/O 请 求 分 配 一 个 优先 级 ,在 设 
备 请 求 队列 中 把 优先 级 高 的 请 求 排 在 前 面 ,如 果 优 先 级 相同 则 按照 FCFS 的 顺序 排列 。 这 
里 的 优先 级 与 进程 调度 中 的 优先 级 往往 是 一 致 的 ,这 样 有 助 于 高 优先 级 的 进程 优先 执行 , 优 


4. 设备 独立 性 


为 了 让 用 户 不 必 了 解 设备 的 工作 细节 以 及 处 理 的 方式 ,设备 管理 要 提供 用 户 操 作 与 物 
理 设 备 的 无 关 性 。 即 做 到 把 用 户 程序 和 具体 的 物理 设备 隔离 开 来 ,用 户 程序 面 对 的 是 迎 辑 
设备 ,而 分 配 程序 在 系统 中 把 逻辑 设备 转换 成 物理 设备 之 后 ,再 根据 要 求 的 物理 设备 号 进行 
分 配 。 

逻辑 设备 是 实际 物理 设备 属性 的 抽象 , 它 并 不 限于 某 个 具体 的 设备 ,而 是 对 应 一 批 设 
备 。 系 统 中 为 某 一 类 设备 规定 一 个 符号 名 , 称 之 为 逻辑 设备 名 。 在 应 用 程序 中 ,用 户 使 用 他 
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辑 设备 名 来 请 求 使 用 某 类 设备 ,例如 ,使 用 PRN 代表 所 有 具有 打印 机 属性 的 设备 。 而 具体 
执行 时 ,对 应 的 物理 设备 则 可 由 系统 根据 设备 的 忙碌 情况 来 确定 。 这 非常 类 似 于 存储 管理 
中 的 逻辑 地 址 与 物理 地 址 的 概念 ,在 应 用 程序 中 使 用 的 是 逻辑 地 址 ,而 系统 在 分 配 和 使 用 内 
存 时 使 用 的 是 物理 地 址 。 

为 了 实现 逻辑 设备 名 到 物理 设备 名 的 映射 ,系统 为 每 一 进程 设置 一 张 联系 逻辑 设备 名 
和 物理 设备 名 的 映像 表 LUT(Logical Unit Table, 逻辑 和 设备 名 ”| 系统 设 徊 家 指针 
设备 表 ) ,并 将 该 表 放 入 进程 的 PCB 中。 当 进 程 用 逻辑 设 /devitty 3 























备 名 请 求 分 配 设备 时 ,系统 为 它 分 配 相 应 的 设备 ,并 在 dev/printer 3 
LUT 中 填写 近 辑 设备 名 和 系统 设备 表 对 应 的 设备 表 指 一 一 一 一 - 
针 , 当 进程 进行 IO 操作 时 ,就 可 找到 对 应 的 物理 设备 和 图 6-15 LUT 


驱动 程序 ,如 图 6-15 所 示 。 
6.5.3 设备 分 配 程序 


根据 设备 分 配 策略 与 原则 ,使 用 系统 提供 的 SDT、DCT、COCT 及 CHCT 等 数据 结构 ， 
当 某 个 进程 提出 W/O 请 求 后 ,系统 将 调用 设备 分 配 程序 进行 设备 分 配 , 其 主要 步骤 如 下 : 

(1) 分 配 设备 。 当 进程 提出 1/O 请 求 时 ,系统 根据 请 求 的 逻辑 设备 名 ,首先 从 SDT 中 
找 出 第 一 个 该 类 设备 的 DCT, 若 该 设备 忙 ,又 查找 第 二 个 该 类 设备 的 DCT, 仅 当 所 有 该 类 
设备 都 忙 时 , 才 把 进程 插入 该 类 设备 的 等 待 队列 中 ; 若 找到 空闲 的 该 类 设备 , 便 按照 一 定 的 
算法 计算 本 次 设备 分 配 的 安全 性 。 如 果 不 会 导致 系统 进入 不 安全 状态 , 便 将 设备 分 配给 请 
求 的 进程 ; 否则 ,将 其 PCB 插入 设备 等 待 队列 中 。 

(2) 分 配 控制 器 。 在 系统 把 设备 分 配给 请 求 的 进程 后 ,再 到 DCT 中 找 出 与 该 设备 连接 
的 控制 器 的 COCT ,从 COCT 的 状态 字段 中 可 知 该 控制 器 是 否 忙 碌 。 若 忙 , 便 将 该 进程 的 
PCB 插入 该 控制 器 的 等 待 队 列 中 ; 否则 , 便 将 控制 器 分 配给 请 求 的 进程 。 

(3) 分 配 通道 。 假 如 还 有 通道 , 则 查找 与 该 控制 器 连接 的 通道 的 CHCT。 若 该 通道 忙 ， 
便 将 该 进程 的 PCB 插入 该 通道 的 等 待 队列 中 ; 否则 , 便 将 该 通道 分 配给 请 求 的 进程 。 

由 此 可 知 , 在 进行 /O 传输 时 ,只 有 在 设备 ,控制 器 和 通道 三 者 都 分 配 成 功 时 ,这 次 分 
配 才 算 成 功 ,然后 便 可 启动 该 I/O 设备 进行 数据 传送 。 


6.5.4 SPOOLing 技术 
1. 什么 是 SPOOLing 技术 


系统 中 的 独占 设备 是 有 限 的 ,往往 不 能 满足 诸多 进程 的 要 求 , 因 而 会 造成 大 量 进 程 由 于 
等 待 某 些 独占 设备 而 阻塞 ,成 为 系统 中 的 瓶 人 开 。 男 一 方面 ,申请 到 独占 设备 的 进程 在 其 整个 
运行 期 间 虽 然 占有 设备 ,但 利用 率 却 常 常 很 低 , 设 备 还 是 经 常 处 于 空 亲 状态。 为 了 解决 这 种 
了 矛盾 ,最 常用 的 方法 就 是 用 共享 设备 来 模拟 独占 设备 的 操作 ,从 而 提高 系统 效率 和 设备 利用 
率 。 这 种 技术 就 称 为 虚拟 设备 技术 ,该 技术 是 对 脱 机 输入 输出 系统 的 模拟 ,利用 一 道 程序 来 
模拟 脱 机 输入 输出 时 的 外 围 控 制 机 的 功能 ,把 低速 的 1O 设备 上 的 数据 传送 到 高 速 的 磁盘 
上 。 这 样 , 便 可 在 主机 的 直接 控制 下 ,实现 脱 机 输入 输出 功能 。 此 时 的 外 围 操作 与 CPU 对 
数据 的 处 理 同时 进行 ,这 种 在 联机 情况 下 实现 的 同时 外 围 操作 称 为 SPOOLing 
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(Simultaneous Peripheral Operation OnLine) 技 术 。 通 过 SPOOLing 技术 便 可 将 一 台独 占 
的 物理 I/O 设备 虚拟 为 多 台 共 享 的 逻辑 I/O 设备 。 


2. 系统 的 工作 原理 


如 图 6-16 所 示 ,在 采用 SPOOLing 技术 的 系统 中 ,多 台 外 围 设备 通过 通道 或 DMA 器 
件 与 外 存 连 接 起 来 ,在 外 存 中 开辟 两 大 存储 空间 ,分 别称 为 输入 井 和 输出 井 ,用 来 模拟 脱 机 
输入 输出 时 的 磁盘 , 暂 存 输入 输出 的 数据 。 而 数据 的 传输 由 主机 中 的 输出 管理 模块 和 输入 
管理 模块 来 控制 。 利 用 这 两 个 模块 来 模拟 脱 机 I/O 时 的 外 围 控制 机 。 其 中 ,输入 管理 模块 
模拟 输入 时 的 外 围 控 制 机 ,将 用 户 要 求 的 数据 从 输入 设备 输入 到 输入 缓冲 区 ,然后 再 把 数据 
从 输入 缓冲 区 送 入 输入 井 , 当 CPU 需要 输入 数据 时 ,直接 从 输入 井 读 入 内 存 ; 输出 管理 模 
块 模拟 输出 时 的 外 围 控 制 机 ,将 用 户 要 求 的 数据 从 内 存 送 到 输出 井中 , 待 设备 空闲 时 ,再 将 
输出 井中 的 数据 经 输出 缓冲 区 送 到 输出 设备 上 。 
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图 6-16 SPOOLing 系统 


下 面 就 以 常见 的 共享 打印 机 为 例 , 说 明 输 出 SPOOLing 技术 的 基本 原理 。 打 印 机 是 一 
种 典型 的 独占 设备 ,引入 SPOOLing 技术 后 , 当 用 户 进 程 请 求 打印 输出 时 ,打印 请 求 将 传递 
给 SPOOLing 系统 ,而 并 不 是 真正 把 打印 机 分 配给 该 进程 。SPOOLing 系统 的 输出 进程 在 
磁盘 上 申请 一 个 空闲 区 ,把 需要 打印 的 数据 传送 到 空闲 区 中 ,再 把 用 户 的 打印 请 求 插入 打印 
队列 。 如 果 打 印 机 空闲 ,就 会 从 打印 队列 中 取出 一 个 请 求 , 再 从 磁盘 上 的 指定 区 域 取出 数 
据 , 执 行 打印 操作 。 由 于 磁盘 是 共享 的 ,因此 SPOOLing 系统 可 以 随时 响应 打印 请 求 并 把 
数据 缓存 起 来 ,这 样 就 把 独占 设备 改造 成 了 共享 设备 ,从 而 提高 了 设备 的 利用 率 和 系统 


3. 引入 SPOOLing 技术 的 优点 


引入 SPOOLing 技术 可 以 带 来 以 下 优点 : 
(1) 提高 了 1/O 的 速度 。 在 SPOOLing 系统 中 ,将 对 低速 的 1/O 设备 进行 的 1/O 操作 
转变 为 对 输入 井 或 输出 井中 的 数据 的 存 取 ,如 同 脱 机 输入 输出 一 样 ,提高 了 1/O 速度 ,缓和 
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了 CPU 与 低速 IO 设备 之 间 速 度 不 匹配 的 矛盾 。 

(2) 将 独占 设备 改造 为 共享 设备 。 在 SPOOLing 系统 中 ,实际 上 并 没有 为 任何 进程 分 
配 设备 ,而 只 是 在 输入 井 或 输出 井中 为 进程 分 配 一 个 存储 区 。 这 样 就 把 独占 设备 改造 为 共 
享 设备 。 

(3) 实现 了 虚拟 设备 功能 。 宏 观 上 ,虽然 是 多 个 进程 在 同时 使 用 一 台独 占 设 备 ,但 是 对 
于 每 一 个 进程 而 言 ,它们 都 会 认为 自己 独占 了 一 个 设备 。 当 然 ,该 设备 是 多 辑 上 的 设备 。 
此 ,SPOOLing 系统 实现 了 将 独占 设备 改造 成 若干 台 对 应 的 虚拟 设备 的 功能 。 


6.6 逻辑 /O 系统 


前 面 各 节 在 描述 了 1/O 数据 传送 控制 方式 的 基础 上 讨论 了 中 断 、 驱 动 程序 、 缓 冲 技术 
以 及 设备 分 配 策略 与 算法 。 那 么 ,系统 在 何 时 分 配 设备 ,在 何 时 申请 缓冲 ,由 哪个 进程 进行 
中 断 响应 呢 ? 另外 ,尽管 CPU 发 出 了 启动 设备 的 命令 ,设备 的 启动 以 及 I/O 控制 器 中 有 关 
寄存 器 的 值 由 谁 来 设置 呢 ? 这 些 都 由 逻辑 MO 系统 中 对 应 的 I/O 控制 进程 来 完成 。 因 此 ， 
1/O 请 求 处 理 模块 .设备 分 配 模块 .缓冲 区 管理 模块 和 中 断 原因 分 析 模 块 等 都 是 多 辑 1/O 系 
统 的 组 成 部 分 。 图 6-17 是 IO 控制 进程 的 功能 示意 图 。 
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图 6-17 1/O 控制 进程 的 功能 


WO 控制 进程 首先 分 析 调 用 1/O 控制 进程 的 原因 : 是 外 设 来 的 中 断 请 求 还 是 进程 来 的 
1/O 请 求 ,然后 ,根据 不 同 的 请 求 , 调 用 不 同 的 程序 模块 进行 相应 的 处 理 。 

WO 请 求 处 理 是 用 户 进程 和 设备 管理 程序 接口 的 一 部 分 , 它 把 用 户 进程 的 1/O 请 求 变 
为 设备 管理 程序 所 能 接受 的 信息 。 一 般 来 说 ,用 户 的 1/O 请 求 包括 : 申请 进行 的 1/O 操作 
的 轨 辑 设备 名 、 要 求 的 操作 ,传送 数据 的 长 度 和 起 始 地 址 等 。I/O 请 求 处 理 模 块 对 用 户 的 
1/O 请 求 进行 处 理 , 它 首先 将 1/O 请 求 中 的 逻辑 设备 名 转换 为 对 应 的 物理 设备 名 ; 然后 , 检 
查 1/O 请 求 命令 中 是 否 有 参数 错误 ; 若 请 求 命令 参数 正确 , 它 把 该 命令 插入 指向 相应 DCT 
的 I/O 请 求 队列 ,然后 启动 设备 分 配 程序 。 在 有 通道 的 系统 中 ,I/O 请 求 处 理 模块 还 将 按 
LI/O 请 求 命令 的 要 求 编制 通道 程序 。 在 设备 分 配 程序 为 1/O 请 求 分 配 了 相应 的 设备 、 控 制 
器 和 通道 之 后 ,1/O 控制 进程 还 将 启动 缓冲 区 管理 模块 为 此 次 1/O 传送 申请 必要 的 缓冲 区 ， 
然后 把 IO 请 求 命令 写 到 缓冲 区 中 并 将 该 缓冲 区 插入 设备 的 IO 请 求 队列 。 
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在 数据 传送 结束 后 ,外 设 发 出 中 断 请 求 ,I/O 控制 进程 将 做 出 中 断 响应 ,调用 中 断 处 理 
程序 。 对 于 不 同 的 中 断 , 其 善后 的 处 理 不 同 。 例 如 ,处理 结束 中 断 时 ,释放 相应 的 设备 .控制 
器 和 通道 ,并 唤醒 正在 等 待 该 操作 完成 的 进程 。 另 外 ,还 要 检查 是 否 还 有 等 待 该 设备 的 IO 
请 求 命令 ,如 有 , 则 进行 下 一 个 I/O 传送 。 


6.7 Linux 的 设备 管理 


Linux 的 设备 管理 的 主要 任务 是 控制 设备 完成 输入 输出 操作 ,所 以 又 称 输入 输出 (1/O) 
子 系统 。 它 的 任务 是 把 各 种 设备 硬件 的 复杂 物理 特性 的 细节 屏蔽 起 来 ,对 各 种 不 同 设备 提 
供 一 个 使 用 统一 方式 进行 操作 的 接口 。Linux 把 设备 看 作 特 殊 的 文件 ,系统 通过 处 理 文件 
的 接口 一 一 虚拟 文件 系统 (VFS) 来 管理 和 控制 各 种 设备 。 


6.7.1 逻辑 VO 管理 


则 辑 I/O 层 是 用 户 程 序 与 驱动 程序 的 接口 ,实现 逻辑 设备 与 物理 设备 的 映射 ,为 设备 
分 配 缓冲 区 ,将 设备 分 配给 请 求 进程 。Linux 设备 管理 的 基本 特点 是 把 物理 设备 看 作文 件 ， 
称 为 设备 文件 。 管 理 控制 设备 采用 处 理 文件 的 接口 和 系统 调用 来 进行 。 


1. Linux 设备 的 分 类 


在 Linux 中 ,设备 被 分 为 3 类 : 字符 设备 , 块 设备 和 网 络 设备 。 

字符 设备 通常 缩写 为 cdev, 它 是 不 可 寻 址 的 ,是 以 字符 为 单位 输入 输出 数据 的 设备 。 
常用 的 字符 设备 有 键盘 鼠标, 打印机。 字符 设备 是 通过 直接 访问 称 为 字符 设备 节点 的 特殊 
设备 文件 来 访问 的 。 

块 设备 通常 缩写 为 blkdev, 它 是 可 寻 址 的 , 扇 区 是 物理 上 的 最 小 寻 址 单元 ,而 迎 辑 上 的 
最 小 寻 址 单元 是 块 。 块 是 文件 系统 的 一 种 抽象 ,是 以 一 定 大 小 的 数据 块 为 单位 输入 输出 数 
据 的 。 由 于 在 块 设备 中 物理 寻 址 单元 为 扇 区 ,所 以 , 块 不 能 比 扇 区 小 ,只 能 是 扇 区 的 整数 倍 
大 小 。 在 块 设备 与 内 存 之 间 传 送 数 据 需 要 使 用 缓冲 区 。 常 用 的 块 设备 有 硬盘 、 光 级、 闪存 
(flash) 设 备 。 块 设备 通过 称 为 块 设备 节点 的 特殊 文件 来 访问 ,并 且 通 常 被 挂 载 为 文件 

网 络 设备 是 通过 通信 和 网络 传输 数据 的 设备 ,一 般 指 与 通信 和 网络 连接 的 网 络 适配器 (网 
卡 ) 等 。 网 络 设备 打破 了 “所 有 设备 都 是 文件 ”的 设计 原则 , 它 不 是 通过 设备 节点 来 访问 ,而 
是 通过 套 接 字 API 这 样 的 特殊 接口 来 访问 。 





2. 设备 映射 


Linux 系统 提供 了 统一 命名 文件 和 设备 的 方法 , 即 以 文件 系统 的 路 径 名 来 命名 设备 ,而 
用 户 不 必 知 道 哪个 名 字 对 应 哪个 设备 ,逻辑 IO 层 负 责 把 设备 的 符号 名 映射 到 对 应 的 设备 
驱动 程序 上 。 

Linux 使 用 设备 类 型 . 主 设备 号 ,次 设备 号 来 识别 设备 。 首 先 看 设备 类 型 是 字符 设备 还 
是 块 设备 。 按 照 设 备 使 用 的 驱动 程序 不 同 而 赋予 设备 不 同 的 主 设备 号 , 主 设备 号 是 与 驱动 
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程序 一 一 对 应 的 ,使 用 次 设备 号 来 区 分 一 种 设备 中 的 各 个 具体 设备 。 也 就 是 说 ,次 设备 号 用 
来 区 分 使 用 同一 个 驱动 程序 的 个 体 设备 。 例 如 ,系统 中 的 块 设备 IDE 硬盘 的 主 设备 号 是 3， 
而 多 个 IDE 硬盘 及 其 各 个 分 区 分 别 赋予 次 设备 号 1 ,2,3,…。 

Linux 使 用 虚拟 文件 系统 作为 统一 的 操作 接口 来 处 理 文件 和 设备 。 与 普通 的 目录 和 文 
件 一 样 ,每 个 设备 也 使 用 一 个 VFS inode 来 描述 ,其 中 包含 设备 类 型 ( 块 设备 或 字符 设备 ) 的 
主 , 次 设备 号 。 对 设备 的 操作 也 是 通过 对 文件 操作 的 file_operations 结构 体 来 调用 驱动 程 
序 的 设备 服务 子 程序 。 例 如 , 当 进 程 要 求 从 某 个 设备 上 输入 数据 时 ,由 该 设备 的 file_ 
operations 结构 体 得 到 服务 子 程序 的 操作 函数 入 口 ,然后 调用 其 中 的 read() 函数 完成 数据 
输入 操作 。 同 样 ,使 用 file_operations 中 的 open() 、close() 、write() 分 别 完成 设备 的 启动 、 
停止 设备 运行 、 向 设备 输出 数据 的 操作 。 


3. 缓冲 区 


在 进程 IO 传输 时 ,系统 为 数据 传输 提供 缓冲 区 。 当 一 个 块 被 调和 人 内存, 读 和 或 等 竺 
写 人 时 , 它 首先 要 存储 在 一 个 缓冲 区 中 。 每 个 缓冲 区 与 一 个 块 对 应 , 它 相当 于 磁盘 块 在 内 存 
中 的 表示 。 块 包含 一 个 或 多 个 扇 区 ,但 不 能 超过 一 个 页 面 ,所 以 一 个 页 面 可 以 容纳 一 个 或 多 
个 内 存 中 的 块 。 为 了 对 缓冲 区 进行 管理 ,每 个 缓冲 区 都 有 一 个 称 为 区 头 的 对 应 的 描述 符 ,该 
描述 符 用 buffer_head 结构 体 表 示 , 它 包含 了 内 核 操作 缓冲 区 所 需 的 信息 。 缓 冲 区 头 描述 
了 磁盘 块 与 内 存 页 面 之 间 的 映射 关系 , 它 也 是 所 有 块 IO 操作 的 容器 。 

用 缓冲 区 头 来 管理 内 核 的 1/O 操作 主要 存在 两 个 弊端 。 首 先 ,对 内 核 而 言 , 操 作 内 存 
页 面 是 最 为 简便 和 高 效 的。 而 通过 一 个 巨大 的 缓冲 区 头 表示 每 一 个 缓冲 区 (可 能 比 页 面 
小 ) ,对 数据 的 操作 效率 低下 。 其 次 ,每 个 缓冲 区 头 只 能 表示 一 个 块 ,所 以 内 核 在 处 理 大 数据 
时 会 分 解 为 对 一 个 个 小 块 的 操作 ,会 造成 不 必要 的 负担 和 空间 浪费 。 所 以 在 从 Linux 2. 6 
开始 的 内 核 中 ,缓冲 区 头 的 作用 大 大 降低 了 。bio 结构 体 的 出 现 就 是 为 了 改善 缓冲 区 头 的 
这 两 个 弊端 。 

目前 内 核 块 1/O 操作 的 基本 容器 由 bio 结构 来 表示 。 它 表示 了 正在 现场 的 (活动 的 ) 以 
片段 链表 形式 组 织 的 块 /O 操作 。 一 个 片段 是 内 存 中 一 小 块 连续 的 内 存 区 域 。 每 一 个 块 
1/O 请 求 都 通过 一 个 bio 结构 体 表 示 。 每 个 请 求 包含 一 个 或 多 个 块 ,这 些 块 存储 在 bio_vec 
结构 体 数组 中 ,每 个 bio_vec 结构 体 描述 了 一 个 片段 在 物理 页 中 的 实际 位 置 。 每 个 bio_vec 
都 对 应 一 个 页 面 ,这 些 页 面 可 以 不 连续 存放 。 整 个 bio_vec 结构 体 数 组 构成 一 个 完整 的 组 
冲 区 ,从 而 保证 内 核能 够 方便 、 高 效 地 完成 IO 操作 。 

bio 相当 于 在 缓冲 区 上 又 封装 了 一 层 , 使 得 内 核 在 1/O 操作 时 只 要 针对 一 个 或 多 个 内 
存 页 面 即 可 ,不 用 再 去 管理 磁盘 块 的 部 分 。 





4. MO 调度 


内 核 除了 要 完成 I/O 操作 以 外 ,还 要 调度 好 所 有 1/O 操作 请 求 ,尽量 确保 每 个 请 求 能 
有 合理 的 响应 时 间 。 

为 了 保证 磁盘 寻 址 的 效率 ,一 般 会 尽量 让 磁头 向 一 个 方向 移动 ,等 到 头 了 再 反 过 来 移 
动 ,这 样 可 以 缩短 所 有 请 求 的 磁盘 寻 址 总 时 间 。 磁 头 的 移动 有 点 类 似 于 电梯 ,所 以 这 个 IO 
调度 算法 也 叫 电梯 调度 算法 。Linux 电梯 调度 主要 是 对 I/O 请 求 进行 合并 和 排序 。 
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内 核 中 内 置 了 上 面 4 种 1/O 调度 ,可 以 在 启动 时 通过 命令 行 选项 elevator 一 XXX 来 
启用 任何 一 种 。 但 有 一 个 新 请 求 加 入 1/O 请 求 队列 时 ,与 最 终 期 限 1/O 调度 相 比 ,预测 IO 
调度 多 了 以 下 操作 : 预测 1/O 调度 算法 中 最 重要 的 是 保证 等 待 期 间 不 要 浪费 ,也 就 是 提高 
预测 的 准确 性 ,目前 这 种 预测 依靠 一 系列 的 启发 和 统计 工作 ,预测 I/O 调度 程序 会 跟踪 并 
统计 每 个 应 用 程序 的 1/O 操作 习惯 ,以 便 正 确 预测 应 用 程序 的 读 写 行为 。 

如 果 预 测 的 准确 率 足 够 高 ,那么 和 最 终 期 限 I/O 调度 相 比 ,预测 I/O 调度 既 能 提高 读 
请 求 的 响应 时 间 ,又 能 提高 系统 吞吐 量 。 


6.7.2 用 户 与 设备 驱动 程序 


Linux 内 核 是 模块 化 的 ,内 核 中 的 模块 可 以 按 需 加 载 ,从 而 保证 内 核 启动 时 不 用 加 载 所 
有 的 模块 , 既 减 少 了 内 核 的 大 小 ,也 提高 了 效率 。 所 以 ,设备 驱动 程序 可 以 以 模块 形式 提供 ， 
可 以 动态 地 加 载 和 仓 载 。 

系统 对 设备 的 控制 和 操作 是 由 设备 驱动 程序 完成 的 。 设 备 驱动 程序 由 设备 服务 子 程序 
和 中 断 处 理 程序 组 成 。 设 备 服务 子 程序 包括 了 对 设备 进行 各 种 操作 的 代码 ,中 断 处 理子 程 
序 处 理 设备 中 断 。 

如 果 人 逻辑 I/O 层 要 访问 某 设备 ,必须 找到 该 设备 的 驱动 程序 ,然后 再 执行 相应 的 驱动 
程序 函数 。 为 此 ,在 Linux 中 ,内 核定 义 了 两 个 数据 结构 数组 ,分 别称 为 块 设备 转换 表 和 字 
符 设 备 转换 表 。 每 个 驱动 程序 在 其 相应 的 数组 中 占 一 个 表 项 。 

用 户 空间 访问 设备 时 ,通过 open() 调 用 返回 的 文件 描述 符 找 到 代表 该 设备 的 struct 
file 结构 指针 ,从 而 找到 设备 的 i 节点 ,从 i 节点 中 检查 其 类 型 是 块 设备 还 是 字符 设备 ,从 i 
节点 中 提取 设备 号 ,通过 设备 号 从 块 设备 或 者 字符 设备 转换 表 中 找到 相应 的 设备 驱动 程序 ， 
由 file_operations 定义 设备 驱动 程序 提供 给 VFS 的 接口 函数 。 


6.7.3 设备 模型 


Linux 2.6 内 核 最 初 为 了 满足 电源 管理 的 需要 ,提出 了 一 个 设备 模型 来 管理 所 有 的 设 
备 。 在 物理 上 ,外 设 之 间 是 有 层次 关系 的 ,如 果 操 作 系 统 要 进入 休眠 状态 ,首先 要 逐 层 通知 
所 有 的 外 设 进入 休眠 模式 ,然后 整个 系统 才 可 以 休眠 。 因 此 ,需要 有 一 个 树 状 的 结构 把 所 有 
的 外 设 组 织 起 来 。 这 就 是 最 初 建立 Linux 设备 模型 的 目的 。 

设备 模型 提供 了 一 个 独立 的 机 制 来 表示 设备 ,并 描述 设备 在 系统 中 的 树 状 结构 ,使 代码 
重复 最 小 化 ; 用 户 就 可 以 通过 这 棵 树 去 遍历 所 有 的 设备 ,建立 设备 和 驱动 程序 之 间 的 联系 ， 
也 可 以 对 设备 进行 归 类 ; 引入 统一 的 编程 机 制 ,让 开发 者 可 以 开发 出 安全 、 高 效 的 驱动 
程序 。 

设备 模型 的 核心 结构 是 kobject, 类 似 面向 对 象 语言 中 的 基 类 , 它 嵌 入 到 更 大 的 对 象 中 ， 
用 来 描述 设备 模型 的 组 件 ,用 它 提 供 的 字段 可 以 创建 对 象 的 层次 结构 。 为 了 方便 调试 ,设备 
模型 开发 者 决定 将 设备 结构 导出 为 一 个 文件 系统 ,由 此 产生 了 一 个 新 的 文件 系统 一 一 
sysfs。sysfs 文件 系统 与 kobject 结构 紧密 关联 ,每 个 在 内 核 中 注册 的 kobject 对 象 都 对 应 
sysfs 文件 系统 中 的 一 个 目录 。 

ysfs 文件 系统 是 虚拟 的 文件 系统 , 它 可 以 产生 一 个 包含 所 有 系统 硬件 的 层次 视图 ,并 向 
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用 户 程 序 提供 详细 的 内 核 数 据 结构 信息 ,帮助 用 户 以 一 种 简单 的 文件 系统 方式 来 观察 系统 
中 各 种 设备 的 树 形 结构 ,给 用 户 提供 了 一 个 从 用 户 空间 访问 内 核 设备 的 方法 , 它 在 Linux 里 
的 路 径 是 /sys。 这 个 目录 并 不 是 存储 在 硬盘 上 的 真实 的 文件 系统 ,只 有 在 系统 启动 之 后 , 它 
才 会 建 起 来 。 


习题 


. 设备 管理 的 主要 任务 是 什么 ? 
. 操作 系统 中 的 I/O 系统 软件 一 般 分 为 几 个 层次 ? 
. 简 述 逻辑 I/O 系统 的 主要 功能 。 
. 常用 的 数据 传送 控制 方式 有 哪些 ? 试 比较 它们 的 优 缺 点 。 
. 试 画 出 采用 DMA 控制 方式 时 CPU 和 设备 的 工作 流程 图 。 
. 什么 叫 通道 ? 它 有 什么 特点 ? 
. 按照 信息 交换 方式 的 不 同 ,通道 可 以 分 为 哪 几 种 类 型 ? 
. 试 述 中 断 处 理 过 程 的 主要 步骤 。 
. 设备 驱动 程序 的 特点 是 什么 ? 简 述 设备 驱动 程序 处 理 的 主要 步骤 。 
. 引入 缓冲 技术 的 主要 原因 有 哪些 ? 
. 什么 是 缓冲 池 ? 试 设计 一 个 数据 结构 来 管理 缓冲 池 。 
12. 用 于 设备 管理 的 数据 结构 有 哪些 ?它们 之 间 的 关系 是 什么 ? 
13. 简 述 设备 分 配 的 工作 流程 。 
14. 什么 是 SPOOLing 系统 ? 它 有 什么 特点 ? 
15. 基于 本 章 介绍 的 1/O 系统 结构 及 数据 结构 ,举例 说 明 从 用 户 进程 请 求 某 1/O 操作 
开始 到 该 /O 操作 完成 的 工作 过 程 。 
16. Linux 设备 管理 类 型 有 哪些 ? 
17. ysfs 文件 系统 有 哪些 特点 ? 
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计算 机 中 大 量 的 文件 与 数据 存放 在 不 同 的 存储 介质 中 ,用 户 和 系统 在 使 用 时 需要 频繁 
地 对 它们 进行 访问 。 如 果 由 用 户 直接 管理 外 存 上 的 文件 ,不仅 要 求 用 户 熟 悉 外 存 特 性 ,了 解 
各 种 文件 的 属性 以 及 它们 在 外 存 上 的 位 置 ,而 且 在 多 用 户 环境 下 ,还 必须 能 保持 数据 的 安全 
性 和 一 致 性 。 显 然 , 这 是 用 户 所 不 能 胜任 ,也 不 愿意 承担 的 工作 。 而 在 实际 应 用 中 ,用 户 所 
关心 的 并 不 是 这 些 资 源 存 放 在 哪里 ,而 是 能 否 安全 可 靠 方便、 准确 地 存 取 和 访问 这 些 资 
源 。 为 此 ,在 操作 系统 中 引入 并 建立 了 文件 管理 系统 ,以 完成 外 存 上 的 大 量 文件 信息 的 
管理 。 

本 章 主 要 讲述 文件 ,文件 系统 ,文件 的 组 织 和 存 取 以 及 文件 的 保护 。 


Ca 文件 和 文件 系统 





7.1.1 文件 的 概念 


在 操作 系统 中 使 用 文件 系统 来 组 织 和 管理 在 计算 机 中 存储 的 大 量程 序 和 数据 ; 或 者 
说 ,文件 系统 的 管理 功能 是 通过 把 它 所 管理 的 程序 和 数据 组 织 成 一 系列 文件 的 方法 来 实现 
的 。 下 面 先 介绍 有 关 文 件 的 几 个 概念 。 


1. 域 


域 (field) 是 最 基本 的 数据 单元 。 一 个 域 包含 一 个 值 .如 学 生 姓名 、 出 生日 期 等 。 域 可 以 
通过 它 的 域名 \ 长 度 和 类 型 来 描述 。 域 名 \ 长 度 和 类 型 可 以 自己 定义 ,长 度 可 以 固定 也 可 以 
不 变 ( 例 如 ,域名 为 学 生 姓名 ,长 度 为 8 位 ,类 型 为 字符 型 )。 


2. 记录 


记录 (record) 是 一 组 相关 的 域 , 用 于 描述 一 个 对 象 在 某 方 面 的 属性 。 例 如 ,一 个 雇员 记 
录 可 以 包括 如 下 域 : 姓名 ,年 龄 .工作 类 型 .雇用 日 期 等 。 一 个 记录 包含 哪些 域 ,通常 是 根据 
实际 情况 来 定 的 。 例 如 ,对 于 一 个 学 生 , 如 果 把 他 作为 一 个 学 生 ,就 需要 包括 学 号 姓名、 年 
龄 ,所 在 班级 等 ; 但 如 果 这 个 学 生生 了 病 ,作为 一 个 病人 时 ,他 的 记录 包括 的 域 就 应 该 是 病 
历 号 、 姓 名、 性 别 、. 身 高 \ 体 重 . 血 压 和 病史 了 。 

为 了 能 唯一 地 标识 一 个 记录 ,必须 在 一 个 记录 的 各 个 域 中 确定 一 个 或 几 个 域 , 把 它 ( 或 
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它们 ) 的 集合 作为 关键 字 (key) 。 关 键 字 是 唯一 能 标识 一 个 记录 的 域 。 通 常 只 需 用 一 个 域 来 
作为 关键 字 , 如 学 号 或 病历 号 ,但 有 时 也 需要 把 几 个 域 组 合 起 来 作为 关键 字 。 


3. 文件 


文件 由 一 组 相似 的 记录 组 成 , 它 被 用 户 和 应 用 程序 看 作 一 个 实体 ,并 可 以 通过 名 字 访 
问 。 事 实 上 用 户 和 应 用 程序 正 是 通过 访问 文件 来 对 数据 和 程序 进行 操作 的 。 文 件 有 一 个 唯 
一 的 文件 名 ,文件 名 的 长 度 因 系统 的 规定 而 异 。 文 件 可 以 被 创建 ,也 可 以 被 删除 。 文 件 可 分 
为 有 结构 文件 和 无 结构 文件 两 种 。 在 有 结构 文件 中 ,文件 由 若干 个 相关 记录 组 成 ; 而 无 结 
构 文 件 则 被 看 成 由 一 个 个 字符 流 组 成 。 文件 也 有 自己 的 属性 ,包括 文件 类 型 .文件 长 度 、 文 
件 的 物理 位 置 和 文件 的 建立 时 间 等 。 


4. 数据 库 


数据 库 是 一 组 相关 的 数据 , 它 的 本 质 特征 就 是 这 组 数据 之 间 存 在 着 明确 的 关系 ,并 且 可 
以 供 许多 不 同 的 应 用 程序 使 用 。 数 据 库 可 能 包含 与 一 个 组 织 或 者 项 目 ( 如 一 家 商场 或 一 项 
科学 研究 ) 相 关 的 所 有 信息 。 数 据 库 自身 是 由 一 种 或 多 种 类 型 的 文件 组 成 的 。 通 常 有 一 个 
单独 的 数据 库 管理 系统 ,会 使 用 操作 系统 的 某 些 文件 管理 程序 来 管理 这 些 文件 。 


7.1.2 文件 的 分 类 


通常 按照 用 途 和 性 质 可 以 把 文件 分 为 3 类 : 

(1) 系统 文件 。 只 允许 用 户 通过 系统 调用 来 执行 它们 ,而 不 允许 对 其 进行 读 写 和 修改 。 
这 些 文件 主要 由 操作 系统 核心 .各 种 系统 应 用 程序 和 数据 组 成 。 

(2) 库 文件 。 该 类 文件 允许 用 户 对 其 进行 读 取 和 执行 ,但 不 允许 对 其 进行 修改 。 库 文 
件 主要 由 各 种 标准 子 程序 库 组 成 (如 C 语言 中 的 各 种 库 函 数 )。 

(3) 用 户 文件 。 该 类 文件 是 用 户 委托 文件 系统 保存 的 文件 。 这 类 文件 只 有 文件 所 有 者 
或 所 有 者 授权 的 用 户 才能 使 用 。 用 户 文 件 主要 由 源 程序 、 目 标 程序 、 用 户 数 据 库 组 成 。 

按 文件 组 织 形式 可 以 把 文件 分 为 3 类 : 

(1) 普通 文件 。 普 通 文件 既 包 括 系统 文件 ,也 包括 用 户 文件 、 库 函数 和 实用 程序 文件 。 
普通 文件 主要 指 组 织 格式 为 系统 中 所 规定 的 最 一 般 的 格式 的 文件 。 

(2) 目录 文件 。 是 由 文件 的 目录 信息 构成 的 特殊 文件 。 即 该 类 文件 不 是 由 各 种 程序 或 
应 用 数据 组 成 的 ,而 是 由 用 来 检索 普通 文件 的 目录 信息 组 成 的 。 

(3) 特殊 文件 。 在 UNIX 文件 系统 中 ,所 有 的 输入 输出 设备 都 被 看 作 特 殊 文件 。 这 些 
特殊 文件 在 使 用 形式 上 与 普通 文件 相同 ,如 查找 目录 、 存 取 操 作 等 。 但 是 ,特殊 文件 的 使 
用 是 和 设备 处 理 程序 紧密 相连 的 。 系 统 必须 把 对 特殊 文件 的 操作 转换 为 对 不 同 设备 的 
操作 。 

另外 ,还 可 以 按 文件 中 的 信息 流向 或 文件 的 保护 级 别 等 分 类 。 按 信息 流向 可 以 把 文件 
分 为 输入 文件 、 输 出 文件 以 及 输入 输出 文件 等 。 按 文件 的 保护 级 别 又 可 分 为 只 读 文 件 、 读 写 
文件 、 可 执行 文件 和 不 保护 文件 等 。 文件 分 类 主要 是 为 了 便于 系统 对 不 同文 件 进行 不 同 的 
管理 ,从 而 提高 处 理 速度 和 起 到 保护 与 共享 的 作用 。 
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7.1.3 文件 管理 系统 


为 了 方便 用 户 使 用 软件 资源 ,现代 计算 机 系统 提供 了 管理 文件 的 软件 机 构 。 操 作 系 统 
中 与 管理 文件 有 关 的 软件 和 数据 称 为 文件 管理 系统 。 一 般 来 说 ,文件 管理 系统 是 用 户 或 应 
用 程序 访问 文件 的 唯一 方式 , 它 使 得 用 户 或 程序 员 不 需要 为 每 个 应 用 程序 开发 专用 管理 软 
件 ,并 且 给 系统 提供 了 控制 资源 的 方法 。 

从 系统 的 角度 讲 , 文 件 管理 系统 负责 对 文件 存储 器 的 存储 空间 进行 组 织 、 分 配 ,存储 文 
件 ,并 对 存 人 的 文件 进行 保护 \ 检 索 。 具 体 来 说 , 它 负责 为 用 户 建立 ` 读 取 、 修 改 、 转 储 文件 ， 
控制 对 文件 的 存 取 ,删除 文件 。 


1. 文件 系统 功能 


从 用 户 的 角度 讲 , 文 件 管理 系统 应 该 实现 按 名 存 取 。 因 此 ,文件 系统 必须 提供 以 下 的 
功能 : 

(1) 文件 存储 空间 的 管理 。 分 配 和 回收 存储 空间 ,提高 存储 空间 的 利用 率 。 

(2) 实现 文件 名 到 物理 地 址 的 映射 。 这 一 映射 功能 对 用 户 是 透明 的 ,用 户 不 必 了 解 文 
件 的 存放 位 置 和 查找 方法 ,只 须 给 出 文件 名 即 可 。 

(3) 实施 对 文件 的 操作 ,包括 建立 、 删 除 、 读 写 和 目录 操作 等 。 

(4) 实现 文件 的 共享 和 提供 文件 保护 功能 。 

(5) 提供 操作 文件 的 接口 ,包括 命令 ,程序 、 菜 单 等 操作 文件 的 方式 。 


2. 文件 系统 软件 结构 


为 了 说 明文 件 管理 的 范围 ,下 面 给 出 文件 系统 的 软件 结构 。 当 然 不 同 的 系统 有 不 同 的 
结构 ,图 7-1 给 出 了 有 具有 代表 性 的 文件 系统 的 软件 结构 。 


用 户 程序 









访问 方法 (无 结构 、 顺 序 、 索 引 、 直 接 ) 
逻辑 文件 系统 
基本 IO 管理 程序 
基本 文件 系统 
磁盘 设备 驱动 程序 磁带 设备 驱动 程序 
图 7-1 文件 系统 的 软件 结构 


在 最 底层 是 设备 驱动 程序 , 它 直接 与 外 围 设备 通信 。 设 备 驱动 程序 负责 启动 该 设备 上 
的 VO 操作 ,并 处 理 各 方面 的 1/O 请 求 。 文 件 操作 所 控制 的 典型 设备 有 磁盘 和 磁带 设备 ， 
设备 驱动 程序 通常 看 作 是 操作 系统 的 一 部 分 。 

接 下 来 的 一 层 称 为 基本 文件 系统 或 物理 I/O 层 。 这 是 与 计算 机 系统 外 部 环境 的 基本 
接口 ,负责 处 理 与 磁盘 或 磁带 系统 交换 的 数据 块 ,因此 , 它 关 注 的 是 这 些 块 在 外 存 设备 和 内 
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存 缓冲 区 的 位 置 ,而 并 不 知道 该 文件 所 涉及 的 数据 或 结构 的 内 容 。 

基本 1/O 管理 程序 负责 所 有 文件 IO 的 开始 和 终止 。 它 根据 所 选择 的 文件 来 选择 执 
行 /O 操作 的 设备 , 它 还 参与 调度 对 磁盘 和 磁带 的 访问 。 除 此 之 外 , 它 还 负责 LO 缓冲 区 
的 指定 和 外 存 的 分 配 。 

逻辑 文件 系统 使 用 户 和 应 用 程序 能 够 访问 到 记录 。 基 本 文件 系统 处 理 的 是 数据 块 ,而 
逻辑 文件 系统 处 理 的 是 文件 记录 。 逮 辑 文件 系统 可 以 维护 文件 的 基本 数据 。 

文件 系统 中 与 用 户 最 近 的 是 访问 方法 层 。 访 问 方法 层 位 于 逻辑 文件 系统 层 之 上 。 不 同 
的 文件 逻辑 结构 对 应 着 不 同 的 访问 方法 。 访 问 方法 层 为 应 用 程序 和 文件 系统 以 及 保存 数据 
的 设备 之 间 提 供 了 一 个 标准 的 接口 。 


3. 文件 的 操作 








为 方便 用 户 使 用 ,文件 系统 以 接口 的 形式 提供 了 一 组 对 文件 和 记录 进行 操作 的 方法 和 
手段 。 常 用 的 文件 操作 系统 调用 主要 有 以 下 几 种 : 

(1) Create。 创 建 一 个 新 的 文件 ,并 设置 文件 的 一 些 基本 属性 。 

(2) Delete。 删 除 指定 的 文件 ,释放 文件 占用 的 空间 。 

(3) Open。 使 用 指定 文件 之 前 ,都 需要 打开 文件 。 系 统 按 用 户 要 求 将 文件 属性 和 地 址 
装 和 人 内存, 以 便 后 续 调 用 。 

(4) Close。 对 文件 不 再 操作 时 , 需 关 闭 指定 文件 。 系 统 将 文件 的 属性 从 内 存 删除 , 释 
放 内 存 空间 。 

(5) Read。 根 据 文件 指针 读 取 指 定 大 小 的 文件 数据 。 

(6) Write。 将 指定 的 数据 写 和 文件 。 

(7) Seek。 把 文件 读 取 指 针 从 当前 位 置 移 到 指定 的 位 置 。 

(8) Get attributes。 获 取 文件 的 一 些 属性 ,如 修改 时 间 、 文 件 类 型 等 。 


4. 文件 的 存 取 方 法 


常用 的 文件 存 取 方法 主要 有 两 种 : 

(1) 顺 存 存 取 。 用 户 可 以 从 头 按 顺 序 读 取 文 件 的 全 部 内 容 ,不 能 跳 过 某 些 内 容 , 只 能 按 
文件 的 顺序 读 取 。 

(2) 随机 存 取 。 用 户 按照 某 个 关键 字 值 而 不 是 按 位 置 读 取 文件 内 容 。 

文件 的 存 取 方 法 与 文件 逻辑 结构 ,物理 结构 及 存储 介质 相关 。 文 本 文件 、 源 程序 等 文件 
适合 顺序 存 取 ,记录 文件 既 可 顺序 存 取 也 可 随机 存 取 。 存 放 在 磁带 上 的 文件 适合 顺序 存 取 ， 
存放 在 磁盘 上 的 文件 既 可 顺序 存 取 也 可 随机 存 取 。 


C2 文件 的 逻辑 结构 


文件 中 记录 的 组 织 方式 被 称 为 文件 的 逻辑 结构 (file logical structure), 它 和 文件 在 外 
存 上 的 存储 方式 不 同 ,后 者 被 称 为 文件 的 物理 结构 。 文 件 的 逻辑 结构 是 从 用 户 观 点 出 发 所 
看 到 的 文件 组 织 形式 ,是 用 户 可 见 的 并 可 以 直接 处 理 的 数据 及 其 结构 ,也 被 称 为 文件 组 织 


(file organization) 。 
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在 设计 文件 系统 时 ,选择 何 种 逻辑 结构 才能 更 有 利于 用 户 对 文件 信息 的 操作 呢 ? 一 般 
情况 下 应 该 遵循 下 述 原则 : 

(1) 快速 访问 。 

(2) 易于 修改 。 

(3) 节约 存储 空间 。 

(4) 维护 简单 。 

(5) 可 靠 性 强 。 

这 些 原则 的 优先 级 别 取决 于 要 使 用 这 些 文 件 的 应 用 程序 。 例 如 ,对 于 用 批 处 理 方式 处 
理 的 文件 ,很 少 进行 快速 检索 某 一 个 记录 的 操作 ,就 不 用 考虑 快速 访问 这 一 原则 。 而 对 于 存 
储 在 CD-ROM 上 的 文件 轻易 不 会 被 修改 ,就 不 用 考虑 易于 修改 这 一 点 。 

有 了 时候 这 些 原则 也 会 相互 矛盾 。 例 如 ,为 了 节约 存储 空间 ,数据 元 余 应 该 很 小 ; 但 在 另 
一 方面 ,提高 元 余 度 又 会 提高 数据 访问 速度 。 这 个 问题 可 以 用 后 面 提 到 的 索引 方式 解决 。 

常用 的 文件 多 辑 结 构 有 4 种 基本 的 类 型 ,实际 系统 中 使 用 的 结构 一 般 都 属于 这 几 种 类 
型 之 一 ,或 者 是 这 几 种 类 型 的 组 合 。 


7.2.1 无 结构 文件 


无 结构 文件 是 一 种 最 简单 的 文件 组 织 形式 (图 7-2(a))。 无 结构 文件 就 像 是 把 数据 堆 起 
来 那样 ,数据 按 它们 到 达 的 顺序 被 采集 ,每 个 记录 由 一 串 数据 组 成 。 与 其 他 结构 的 文件 相 
比 ,无 结构 文件 管理 简单 ,并 能 节省 空间 。 但 是 在 查找 包括 某 个 特定 域 的 某 个 记录 的 时 候 ， 
必须 要 检查 堆 中 的 每 一 个 记录 ,也 就 是 说 要 通过 穷 举 搜索 的 方式 ,对 于 比较 大 的 文件 来 讲 ， 
搜索 效率 不 高 。 所 以 对 基本 信息 操作 不 多 的 文件 ,如 源 程 序 、 可 执行 文件 、 库 函数 等 ,采用 的 
就 是 无 结构 文件 的 形式 。 


7.2.2 顺序 文件 


顺序 文件 是 最 常用 的 文件 组 织 形式 (图 7-2(b))。 在 这 类 文件 中 ,每 个 记录 都 使 用 一 种 
固定 的 格式 ,所 有 记录 都 具有 相同 的 长 度 , 并 且 由 相同 数目 .长度 固 定 的 域 按 特 定 的 顺序 组 
成 。 记 录 的 顺序 安排 有 两 种 方式 : 一 种 是 按照 存 人 时 间 的 先后 排列 ,最 先 存 入 的 记录 作为 
第 一 个 记录 ,以 此 类 推 ; 另 一 种 是 按照 关键 字 排 列 , 可 以 按照 关键 字 的 字母 顺序 、 数 字 顺 序 、 
长 短 等 进行 排列 。 

顺序 文件 的 最 佳 应 用 场合 是 对 所 有 记录 进行 处 理 时 (比如 记 账 或 工资 单 )。 在 这 个 时 候 
顺序 文件 的 存 取 效率 是 所 有 逻辑 文件 中 最 高 的 。 对 顺序 文件 还 可 以 采用 一 些 查找 算法 ,如 
折 半 查找 法 、 差 值 查找 法 等 ,以 提高 查找 效率 。 

在 查询 或 者 更 新 记录 的 交互 式 应 用 中 ,顺序 文件 的 性 能 就 比较 差 了 。 尤 其 是 当 文 件 比 
较 大 时 ,情况 就 更 为 严重 。 例 如 ,对 一 个 含有 10: 个 记录 的 顺序 文件 ,对 它 采用 顺序 查找 法 
去 查找 一 个 指定 的 记录 , 则 平均 需要 查找 5X10 个 记录 。 如 果 想 增加 或 者 删除 一 个 记录 也 
比较 困难 。 为 了 解决 这 个 问题 ,可 以 为 顺序 文件 配置 一 个 运行 记录 文件 (log file) 或 称 为 事 
务 文件 (transaction file) ,把 试图 增加 、 删 除 或 修改 的 信息 记录 在 其 中 ,规定 每 隔 一 段 时 间 ， 
将 运行 记录 文件 与 原来 的 主 文件 加 以 合并 ,产生 一 个 按 关 键 字 排 序 的 新 文件 。 
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(a) 无 结构 文件 (b) 顺序 文件 
完全 索引 完全 索引 部 分 索引 





(©) 索引 文件 
图 7-2 无 结构 文件 ,顺序 文件 和 索引 文件 的 组 织 形式 


7.2.3 索引 文件 


顺序 文件 很 难 对 变 长 记录 实现 直接 存 取 。 为 了 解决 这 个 问题 ,需要 采用 一 种 多 索引 的 
结构 ,每 种 可 能 成 为 搜索 条 件 的 域 都 建立 一 个 索引 ,这 便 是 索引 文件 (图 7-2(c))。 索 引文 件 
一 般 都 握 弃 了 顺序 性 和 关键 字 的 概念 ,只 能 通过 索引 来 访问 记录 。 索 引文 件 对 记录 的 放置 
位 置 没有 限制 ,只 要 至 少 有 一 个 索引 的 指针 指向 这 个 记录 即 可 。 

在 索引 文件 中 可 以 使 用 完全 索引 和 部 分 索引 。 为 了 便于 搜索 ,索引 自身 被 组 织 成 一 个 
顺序 文件 。 完 全 索引 中 包含 主 文件 中 每 条 记录 的 索引 项 ,部 分 索引 只 包含 具有 特定 域 值 的 
记录 的 索引 项 。 在 对 索引 文件 进行 检索 时 ,首先 根据 用 户 ( 程 序 ) 提 供 的 关键 字 检 索索 引 表 ， 
从 中 找 出 相应 的 表 项 ; 再 利用 该 表 项 中 给 出 的 指向 记录 的 指针 值 去 访问 所 需 的 记录 。 而 每 
当 要 向 文件 中 增加 一 个 新 记录 时 , 便 需 对 索引 表 进 行 修改 。 

由 于 索引 文件 的 检索 速度 比较 快 , 索 引文 件 大 多 用 于 对 信息 的 及 时 性 要 求 比较 严格 并 
且 很 少 会 对 所 有 数据 进行 处 理 的 应 用 程序 中 ,例如 航空 公司 订 票 系统 和 商品 库存 控制 系统 。 
使 用 索引 文件 的 缺点 是 对 每 一 个 记录 都 要 建立 一 个 索引 项 ,从 而 占用 了 较 多 的 存储 空间 。 


7.2.4 直接 文件 


采用 前 面 几 种 文件 结构 对 文件 进行 存 取 时 ,都 需要 根据 指定 的 记录 键 值 , 先 对 线性 表 或 
链表 进行 检索 ,以 找到 指定 记录 的 物理 地 址 。 对 于 直接 文件 , 则 可 以 根据 给 定 的 记录 键 值 直 
接 获 得 指定 记录 的 物理 地 址 。 也 就 是 说 ,在 直接 文件 中 ,记录 键 值 本 身 就 决定 了 记录 的 物理 
地 址 。 这 种 由 记录 键 值 到 记录 物理 地 址 的 转换 被 称 为 键 址 转换 (key to address 
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transformation) 。 组 织 直接 文件 的 关键 问题 在 于 用 什么 方法 进行 从 记录 键 值 到 物理 地 址 的 
转换 。 目 前 应 用 最 广泛 的 一 种 直接 文件 是 Hash( 哈 希 ) 文 件 , 它 利用 Hash 函数 (或 称 散 列 
函数 ) 将 记录 键 值 转换 为 相应 记录 的 地 址 。 在 Hash 文件 中 ,为 了 便于 存储 空间 的 动态 分 
配 ,通过 Hash 函数 求 得 的 不 是 相应 记录 的 地 址 ,而 是 指向 一 个 目录 表 相 应 表 目 的 指针 ,该 
表 目 的 内 容 指 向 相应 记录 所 在 的 物理 块 。 如 图 7-3 所 示 , 令 开 为 记录 键 值 , 用 X 作为 通过 
Hash 函数 五 的 转换 所 形成 的 该 记录 在 目录 表 中 对 应 表 目 的 位 置 , 则 有 关系 X 一 互 (K)。 
通常 ,Hash 函数 都 作为 标准 函数 存 于 系统 中 , 供 存 取 文件 时 调用 。 
目录 表 
Hash 函 数 


键 值 K S 


图 7-3 Hash 文件 的 逻辑 结构 
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7.2 节 介 绍 了 文件 的 逻辑 结构 , 即 文件 中 记录 的 组 织 方式 。 无 论 哪 一 种 文件 组 织 方式 ， 
都 是 先 搜索 到 记录 或 信息 的 迎 辑 地 址 ,再 映射 到 对 应 的 物理 地 址 ,最 后 对 物理 地 址 的 有 关 信 
息 进 行 操作 的 。 那 么 多 辑 地 址 怎样 映射 到 物理 地 址 呢 ? 这 是 和 文件 的 物理 结构 密切 相关 
的 。 不 同 的 外 存 分 配方 式 形成 不 同 的 物理 结构 。 例 如 ,采用 连续 分 配方 式 时 的 文件 物理 结 
构 将 是 连续 的 文件 结构 ,采用 链接 分 配方 式 将 形成 链接 式 文 件 结构 ,而 采用 索引 分 配方 式 将 
形成 索引 文件 结构 。 


7.3.1 连续 文件 


在 文件 系统 中 ,存储 设备 通常 划分 为 若干 个 大 小 相等 的 物理 块 ,每 块 长 为 512B 或 
1024B。 与 此 相对 应 ,为 了 有 效 地 利用 存储 设备 和 便于 系统 管理 ,一 般 把 文件 信息 也 划分 为 
与 物理 存储 设备 的 物理 块 大 小 相等 的 逻辑 块 ,并 以 块 作为 分 配 和 传送 信息 的 基本 单位 。 在 
连续 文件 中 ,为 每 一 个 文件 分 配 一 组 相 邻 的 物理 块 ,并 把 迎 辑 文件 中 的 记录 顺序 地 存储 到 相 
邻 的 各 物理 块 中 ,这 样 形成 的 文件 结构 称 为 连续 文件 结构 。 

使 用 这 种 分 配方 式 时 ,为 了 便于 系统 找到 文件 存放 的 地 址 ,应 在 文件 目录 项 的 文件 物理 
地 址 字段 中 记录 该 文件 第 一 个 记录 所 在 的 物理 块 号 和 文件 长 度 ( 占 用 的 物理 块 数 )。 
图 7-4 表示 了 连续 文件 的 存储 空间 分 配 情况 。 文 件 A 从 块 1 始 ,文件 长 度 为 3, 因 此 占用 了 
块 1、 块 2 和 块 3 的 空间 。 

连续 文件 便于 系统 进行 顺序 访问 。 一 旦 知道 了 文件 在 文件 存储 设备 上 的 起 始 地 址 和 文 
件 长 度 ,就 能 很 快 对 文件 进行 存 取 。 这 是 因为 文件 的 逻辑 块 号 到 物理 块 号 的 变换 非常 简单 。 
可 以 说 对 连续 文件 的 访问 速度 是 几 种 存储 空间 分 配方 式 中 最 高 的 一 种 。 

但 是 在 连续 分 配方 式 下 ,由 于 文件 建立 时 空间 的 分 配 和 删除 时 空间 的 回收 会 产生 大 量 
的 碎片 ,会 使 得 再 次 分 配 时 很 难 找到 大 小 合适 的 存储 块 , 因 此 经 常 需 要 执行 紧缩 算法 来 释放 
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文件 A 文件 目录 

DSS AS 
文件 B 文件 名 起 始 块 长 度 

4 5 6 呈 

一 一 文件 A 1 3 
8 9| 10 文件 B 6 5 

文件 C 15 和 
12 13 14 
16 18 19| 
i 


图 7-4 连续 文件 的 分 配 情况 


磁盘 中 的 额外 空间 。 执 行 紧缩 算法 也 需要 耗费 大 量 的 机 器 时 间 。 图 7-5 表示 出 了 连续 文件 
紧缩 后 的 存储 空间 分 配 情况 。 
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文件 A 文 作 B 
‘SN 
文件 目录 
文件 名 起 始 块 长 度 
12| al lal hs 文件 A 9 2 
文件 B 3 5 
16 17| hsf hl 文件 C 3 


图 7-5 连续 文件 紧缩 后 的 存储 空间 分 配 情况 


连续 分 配方 式 的 第 二 个 问题 就 是 在 建立 文件 时 必须 事先 知道 文件 的 长 度 , 这 样 对 于 建 
立 以 后 需要 动态 增长 的 文件 ,由 于 无 法 预知 其 最 终 大 小 ,只 能 进行 估计 ,就 会 造成 增长 过 程 
中 存储 空间 不 够 用 或 者 存储 空间 浪费 的 问题 。 因 此 ,连续 文件 结构 不 适合 用 来 存放 用 户 文 
件 .数据库 文件 等 经 常 被 修改 的 文件 。 


7.3.2 链接 式 文 件 


连续 文件 的 问题 就 在 于 必须 为 一 个 文件 分 配 连续 的 物理 空间 。 为 一 个 逻辑 文件 分 配 物 
理 空间 时 ,不必 给 一 个 文件 分 配 连续 的 物理 空间 ,而 是 可 以 将 文件 装 到 分 散 的 物理 块 中 , 便 
可 以 消除 连续 文件 的 缺点 ,为 此 引入 了 链接 分 配方 式 。 采 用 链接 分 配方 式 时 ,通过 每 个 物理 
块 上 的 链接 指针 ,将 属于 同一 个 文件 的 物理 块 链接 成 一 个 链表 ,这 样 形成 的 物理 文件 就 称 为 





第 7 章 文件 管理 


链接 式 文件 。 
链接 式 文件 又 可 分 为 显 式 链接 和 隐 式 链接 。 在 隐 式 链接 方式 中 ,把 文件 的 起 始 块 和 结 
东 块 放 在 文件 目录 的 目录 项 中 ,而 在 每 个 物理 块 中 包含 指向 下 一 个 块 的 指针 (图 7-6)。 
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图 7-6 隐 式 链接 文件 分 配 


例 7-1 一 个 文件 系统 使 用 大 小 为 256B 的 物理 块 。 每 个 文件 都 有 一 个 目录 项 给 出 了 
文件 名 、 第 一 个 块 的 位 置 . 文 件 的 长 度 和 最 后 一 抉 的 位 置 。 假 设 目录 项 和 最 后 读 取 的 物理 块 
已 经 在 主 存 中 。 在 下 面 的 情况 中 ,请 指出 在 一 个 使 用 链接 分 配 的 系统 中 ,为 了 访问 指定 的 
块 ,需要 读 多 少 个 物理 块 (包括 读 取 指定 的 块 ) 。 

(1) 最 后 读 的 块 号 ,500; 将 要 读 的 块 号 ,200。 

(2) 最 后 读 的 块 号 ,20; 将 要 读 的 块 号 ,21。 

解 : (1) 为 了 找到 块 200, 从 块 1 开始 的 块 链 都 要 读 ,所 以 一 共 需 要 读 200 块 。 

(2) 因为 块 20 中 包含 了 一 个 指向 块 21 的 指针 ,所 以 只 需 读 1 个 块 。 

隐 式 链接 方式 只 适合 逻辑 上 连续 的 文件 ,并 且 只 能 按照 顺序 进行 存 取 。 采 用 直接 存 取 
方式 时 ,不 管 要 存 取 文 件 的 哪 一 个 物理 块 ,都 需要 先 对 此 物理 块 之 前 的 所 有 物理 块 进行 存 
取 , 导 致 效率 极 低 。 

显 式 链接 方式 把 用 于 链接 文件 的 每 个 物理 块 的 一 8 人 FAT 
指针 都 存放 在 内 存 的 一 张 链接 表 中 。 该 表 在 整个 磁 
盘 中 仅 设置 一 张 , 表 的 序号 是 物理 块 号 ,从 0 开始 至 4 
N 一 1,N 为 磁盘 物理 块 总 数 。 在 每 个 表 项 中 存放 链 | 人 ~ 
接 指针 , 即 文件 的 下 一 个 盘 块 号 。 每 一 个 文件 的 链 cp 人 =EOE_ 
首 指针 作为 文件 地 址 被 填 在 该 文件 的 文件 目录 项 的 
物理 地 址 字段 中 。 在 这 种 方式 下 ,对 文件 记录 的 查 
找 是 在 内 存 中 进行 的 ,从 而 可 以 提高 查找 速度 并 减 
少 访问 磁盘 的 次 数 。 由 于 此 链接 表 存 放 了 所 有 分 配 EOF— 
给 文件 的 盘 块 号 ,又 把 该 表 称 为 文件 分 配 表 (File TE 
Allocation Table,FAT) 。 如 图 7-7 所 示 , 文 件 A 占 图 7-7 显 式 链接 文件 分 配 
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用 了 3 个 物理 块 ,其 块 号 依次 为 4、6、11; 文件 B 占 用 了 3 个 物理 块 ,依次 为 9、10、5。 

链接 式 文件 消除 了 外 碎片 ,提高 了 外 存 利用 率 , 并 且 可 以 为 动态 增长 的 文件 动态 分 配 存 
储 空间 ,文件 也 可 以 方便 地 增加 、 修 改 和 删除 。 但 是 ,链接 分 配方 式 不 能 支持 高 效 的 直接 存 
取 , 并 且 文 件 分 配 表 也 需要 占用 较 大 的 内 存 空间 。 


7.3.3 索引 文件 


为 了 解决 链接 式 文件 无 法 高 效 直接 存 取 的 问题 ,文件 管理 中 又 引入 了 索引 分 配方 式 为 
文件 分 配 外 存 空 间 。 采 用 索引 分 配方 式 的 文件 称 为 索引 文件 。 索 引 分 配方 式 为 每 个 文件 分 
配 一 个 索引 块 ,把 分 配给 该 文件 的 所 有 物理 块 号 都 记录 在 该 索引 块 中 ,该 索引 块 就 成 为 一 个 
含有 多 个 物理 块 号 的 数组 。 在 建立 文件 时 ,只 需要 在 为 此 文件 建立 的 目录 项 中 填 上 指向 该 
索引 块 的 指针 即 可 ,如 图 7-8 所 示 。 
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图 7-8 单 级 索引 分 配方 式 


当 文件 的 容量 比较 大 时 ,如果 所 分 配 的 物理 块 号 已 经 装 满 了 一 个 索引 块 ,操作 系统 便 为 
文件 分 配 另 一 个 索引 块 , 用 来 记录 以 后 继续 为 之 分 配 的 物理 块 ,再 通过 链 指针 将 所 有 的 索引 
块 链接 起 来 。 如 果 文 件 太 大 ,其 索引 块 太 多 的 时 候 , 这 种 办 法 的 效率 就 比较 低 了 。 这 时 可 以 
为 这 些 索引 块 再 建立 一 级 索引 , 即 系统 再 分 配 一 个 索引 块 , 作 为 第 一 级 索引 的 索引 块 , 依 次 
将 各 索引 块 的 物理 块 号 填 人 此 索引 表 中 ,这 样 就 形成 了 两 级 索引 分 配方 式 , 如 图 7-9 所 示 。 
如 果 文 件 非常 大 ,还 可 采用 三 级 索引 方式 甚至 多 级 索引 方式 。 

目前 常用 的 索引 分 配方 式 为 混合 索引 分 配 , 即 把 单 级 索引 方式 和 多 级 索引 方式 结合 起 
来 ,以 满足 不 同文 件 的 需要 。 这 种 分 配方 式 下 的 索引 块 的 头 几 项 设计 成 直接 寻 址 方式 ,也 就 
是 这 几 项 所 指 的 物理 块 中 放 的 是 文件 信息 ; 而 索引 表 的 后 几 项 设计 成 多 重 索引 ,也 就 是 间 
接 寻 址 方式 。 在 文件 比较 短 时 ,可 以 利用 直接 寻 址 方式 找到 物理 块 号 而 节省 存 取 时 间 。 

索引 文件 既 适 合 顺序 存 取 , 也 适合 随机 存 取 。 索 引 结构 的 缺点 是 可 能 要 花费 较 多 的 外 
存 空间 。 每 当 建立 一 个 文件 时 , 便 须 为 之 分 配 一 个 索引 块 ,将 分 配给 该 文件 的 所 有 物理 块 号 
记录 于 其 中 。 但 在 一 般 情况 下 ,总 是 中 小 型 文件 居多 ,甚至 有 不 少 文件 只 需 一 两 个 物理 块 ， 
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图 7-9 两 级 索引 分 配 


这 时 如 果 采 用 链接 分 配方 式 , 只 需 设 一 两 个 指针 。 如 果 采 用 索引 分 配方 式 , 则 同样 仍 须 为 之 
分 配 一 个 索引 块 。 存 放 物 理 块 号 的 索引 块 一 般 采 用 一 个 专门 的 物理 块 ,其 中 可 存放 成 百 上 
千 个 物理 块 号 。 因 此 对 于 小 文件 ,采用 索引 分 配方 式 时 ,其 索引 块 的 利用 率 将 是 极 低 的 。 
另外 ,采用 索引 分 配方 式 ,在 存 取 文 件 的 时 候 至 少 要 访问 存储 器 两 次 以 上 。 其 中 ,一 次 
是 访问 索引 表 , 另 一 次 是 根据 索引 表 提 供 的 物理 块 号 访问 文件 信息 。 由 于 文件 在 外 存 设备 
的 访问 速度 较 慢 ,如 果 把 索引 表 放 在 外 存 设 备 上 ,文件 的 存 取 速 度 就 会 大 大 降低 。 常 用 的 办 
法 就 是 在 对 某 个 文件 进行 操作 之 前 ,系统 预先 把 索引 表 放 和 内存。 这样, 在 进行 文件 的 存 取 
时 ,就 可 直接 在 内 存 中 通过 索引 表 确 定 物理 块 号 ,只 需要 访问 一 次 磁盘 ,从 而 提高 访问 速度 。 


和 1 文件 存储 空间 的 管理 


前 面 讨论 了 文件 的 存储 方式 ,也 就 是 用 什么 方式 来 存储 一 个 创建 好 的 文件 。 那 么 ,在 文 
件 新 创建 的 时 候 , 如 何 为 它 分 配 外 存 空间 呢 ? 没有 分 配给 任何 文件 的 空间 通过 什么 方式 进 
行 管理 呢 ? 分 配 外 存 和 分 配 内 存 有 许多 相似 之 处 ,也 可 以 采用 连续 分 配方 式 和 离散 分 配方 
式 。 无 论 采用 哪 种 分 配方 式 ,首先 都 需要 知道 磁盘 中 的 哪些 块 是 可 用 的 ,这 些 可 用 块 需要 一 
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定 的 数据 结构 记录 下 来 ; 其 次 .系统 还 应 该 提供 对 存储 空间 进行 分 配 和 回收 的 方法 。 下 面 
介绍 几 种 常用 的 技术 。 


7.4.1 位 示 图 法 


位 示 图 法 通过 二 进 制 的 一 个 位 来 表示 磁盘 中 一 个 物理 块 的 使 用 情况 ,0 表示 此 盘 块 空 
闲 ,1 表示 此 盘 块 已 经 分 配 。 在 位 示 图 中 ,磁盘 的 每 个 物理 块 都 有 一 个 二 进 制 位 与 之 对 应 ， 
如 图 7-10 所 示 。 
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图 7-10 位 示 图 


采用 位 示 图 法 进行 物理 块 的 分 配 时 ,首先 顺序 扫描 位 示 图 ,从 中 找 出 一 个 或 一 组 其 值 为 
0 的 二 进 制 位 ; 然后 将 找到 的 一 组 二 进 制 位 转换 成 与 之 相对 应 的 物理 块 号 5(5 二 n(i 一 1) 十 
六 假定 找到 的 值 为 0 的 二 进 制 位 位 于 位 示 图 的 第 i 行 第 j 列 ,n 代表 每 行 的 位 数 ); 最 后 修 
改 位 示 图 ,把 刚才 被 分 配 出 去 的 物理 块 号 对 应 的 第 i 行 第 j 列 的 值 由 0 变 为 1。 回 收 时 首先 
将 物理 块 号 转换 成 位 示 图 中 的 行 号 和 列 号 (i 二 (6 一 1)DIV nn 十 1,j 二 (0 一 1) MOD n 十 1), 再 
把 把 相应 的 二 进 制 位 由 1 改 为 0 即 可 。 

位 示 图 法 的 优点 是 可 以 比较 容易 地 找到 一 个 或 一 组 邻接 的 空闲 块 。 另 外 ,由 于 位 示 图 
比较 小 ,因此 可 以 把 它 保存 在 内 存 中 。 在 每 次 分 配 时 ,都 无 须 先 把 位 示 图 读 人 和 人 内存, 从 而 节 
省 了 时 间 。 因 此 ,位 示 图 经 常用 于 微机 和 小 型 机 中 。 


7.4.2 空闲 表 法 


空闲 表 法 是 最 简单 的 一 种 空闲 块 管理 方法 ,属于 连续 分 配方 式 。 空 闲 表 法 就 是 把 磁盘 
中 的 空闲 块 的 块 号 统一 放 在 一 个 称 为 空闲 表 的 物理 块 中 。 空 闲 表 的 每 个 表 项 对 应 一 个 由 多 
个 空闲 块 构成 的 空闲 区 , 它 包括 表 项 序号 .第 一 个 
空闲 块 号 和 该 区 的 空闲 块 数 等 信息 ,如 图 7-11 | 廓 号 | 第 一 个 空间 块 号 | 空闲 块 数 














所 示 。 Il 2 4 
在 系统 为 某 个 文件 分 配 空闲 块 时 ,首先 扫描 2 9 3 
空闲 表 , 如 找到 合适 的 空闲 区 项 , 则 将 该 区 分 配 3 15 5 











给 申请 者 ,并 修改 空闲 表 , 如 果 该 区 的 空闲 块 数 
恰好 等 于 文件 需要 的 块 数 , 则 把 该 项 从 空闲 表 中 图 7-11 空闲 表 
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去 掉 。 当 一 个 文件 被 删除 ,释放 存储 物理 块 时 ,系统 则 把 释放 的 第 一 个 空闲 块 的 块 号 和 
块 数 填 人 空闲 表 的 新 表 项 中 。 在 内 存 管理 中 讨论 的 有 关 空 闲 连续 区 的 分 配 和 释放 算法 
同样 适用 于 磁盘 空闲 区 的 分 配 。 空 闲 表 法 可 以 用 于 内 存 管 理 中 介绍 的 对 换 方 式 中 的 对 
换 空间 的 管理 。 


7.4.3 空闲 链表 法 


空闲 链表 法 是 一 种 较 常用 的 空闲 块 管理 方法 。 空 闲 链表 法 将 所 有 空闲 块 链接 在 一 起 ， 
当 用 户 因 创建 文件 而 请 求 分 配 存储 空间 时 ,分 配 程序 从 链 首开 始 摘 取 所 需要 的 空闲 块 分 配 
给 用 户 , 然 后 调整 链 首 指针 。 当 用 户 因 删除 文件 而 释放 存储 空间 时 , 则 把 释放 的 空闲 块 逐个 
插入 链 尾 。 

空闲 块 的 链接 方法 因 系 统 而 异 ,常见 的 有 按 空闲 区 大 小 顺序 链接 的 方法 、 按 释放 先后 顺 
序 链接 的 方法 以 及 成 组 链接 的 方法 。 成 组 链接 法 是 为 大 型 文件 系统 设计 的 ,是 为 了 避免 空 
闲 表 或 空闲 链表 过 长 。 在 UNIX 系统 中 采用 的 是 成 组 链接 法 。 

成 组 链接 法 首先 将 磁盘 上 的 所 有 空闲 块 划分 成 若干 个 组 ,50 块 一 组 或 100 块 一 组 ,将 
每 一 组 含有 的 空闲 块 总 数 N 和 该 组 所 有 的 空闲 块 号 记 入 前 一 组 的 第 一 个 空闲 块 中 ,这 样 ， 
各 组 的 第 一 个 空闲 块 可 以 链 成 一 条 链 。 如 图 7-12 所 示 ,将 每 100 个 空闲 块 作为 一 组 。 假 定 
盘 上 共有 10 000 个 空闲 块 ,每 块 大 小 为 1KB, 其 中 201 一 7999 号 空闲 块 用 于 存放 文件 ,这 
样 ,该 区 的 最 末 一 组 空闲 块 号 应 为 7901 一 7999 ,次 末 组 为 7801 一 7900…… 第 二 组 为 301 一 
400, 第 一 组 为 201 一 300。 最 后 一 组 后 面 已 经 没有 空闲 块 ,因此 最 后 一 组 只 有 99 个 空闲 块 ， 
在 前 一 组 的 第 100 个 块 号 的 位 置 存放 0, 作 为 空闲 块 链 的 结束 标志 。 
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7-12 空闲 块 的 成 组 链接 法 


另外 在 系统 中 还 设置 了 空闲 块 号 栈 , 用 来 存放 当前 可 用 的 一 组 空闲 块 的 块 号 (最 多 含 
100 个 ) 以 及 栈 中 尚 有 的 空闲 块 号 数 N。 由 于 栈 是 临界 资源 ,每 次 只 允许 一 个 进程 访问 , 故 
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系统 为 栈 设置 了 一 把 锁 。 如 图 7-12 所 示 ,S. free(0) 为 栈 底 , 栈 满 时 的 栈 顶 为 S. free(99) 。 将 
第 一 组 的 空闲 块 总 数 和 所 有 的 空闲 块 号 记 入 空闲 块 号 栈 中 (图 中 的 S. free(0) 一 S. free(99)) ， 
作为 当前 可 供 分 配 的 空闲 块 号 。 

当 系 统 要 为 用 户 分 配 文件 所 需 的 物理 块 时 ,首先 由 分 配 程序 对 空闲 块 栈 进行 检查 ,如 果 
空闲 块 栈 未 上 锁 , 便 从 栈 顶 取出 一 个 空闲 块 号 ,将 与 之 对 应 的 空闲 块 分 配给 用 户 , 然 后 将 栈 
顶 指 针 下 移 一 格 。 若 该 空闲 块 号 已 是 栈 底 , 即 S. free(0) ,说 明 当 前 栈 中 只 有 一 个 可 分 配 的 
空闲 块 ,由 于 在 该 空闲 块 号 所 对 应 的 空闲 块 中 记 有 下 一 组 可 用 的 空闲 块 号 ,因此 , 需 调 用 磁 
盘 读 过 程 ,将 栈 底 空闲 块 号 所 对 应 的 空闲 块 的 内 容 读 入 栈 中 ,作为 新 的 空闲 块 号 栈 的 内 容 ， 
并 把 原 栈 底 对 应 的 空闲 块 分 配 出 去 (其 中 的 有 用 数据 已 读 入 栈 中 )。 然 后 ,再 分 配 一 个 相应 
的 缓冲 区 (作为 该 空闲 块 的 缓冲 区 )。 最 后 ,把 栈 中 的 空闲 块 数 减 1 并 返回 。 

在 系统 回收 空闲 块 时 ,由 回收 程序 将 回收 的 空闲 块 号 记 入 空闲 块 号 栈 的 顶部 ,并 执行 空 
闲 块 数 加 1 操作 。 当 栈 中 空闲 块 号 数目 已 达 100 时 ,表示 栈 已 满 , 便 将 现 有 栈 中 的 100 个 空 
闲 块 号 记 入 新 回收 的 空闲 块 中 ,再 将 其 空闲 块 号 作为 新 栈 底 。 


5 文件 目录 管理 


在 计算 机 系统 中 需要 存储 大 量 的 文件 ,怎样 有 效 地 利用 存储 空间 ,怎样 迅速 准确 地 实现 
文件 的 有 效 存 取 ,怎样 解决 文件 命名 冲突 和 文件 共享 的 问题 ,这 些 都 是 对 目录 管理 的 要 求 。 
在 文件 系统 中 ,把 每 个 文件 的 文件 名 及 其 他 信息 按照 一 定 的 组 织 结构 排列 起 来 , 称 为 这 个 文 
件 的 文件 控制 块 (File Control Block,FCB) ,文件 控制 块 的 有 序 集合 称 为 文件 目录 ,一 个 文 
件 控制 块 就 是 一 个 文件 目录 项 ,一 个 文件 目录 项 也 被 看 作 是 一 个 文件 , 称 为 目录 文件 。 系 统 
通过 目录 文件 来 实现 文件 的 按 名 存 取 和 文件 信息 的 共享 与 保护 。 


7.5.1 文件 控制 块 的 内 容 


文件 控制 块 通常 包括 4 类 信息 ,基本 信息 .地 址 信息 、 访 问 控制 信息 和 使 用 信息 。 如 
表 7-1 所 示 。 





表 7-1 文件 控制 块 的 内 容 














基本 信息 
文件 名 由 创建 者 (用 户 或 程序 ) 选 择 的 名 字 , 在 同一 个 目录 中 必须 是 唯一 的 
文件 类 型 例如 文本 文件 .二 进 制 文件 等 
文件 组 织 指出 文件 的 逻辑 结构 
文件 物理 结构 指出 文件 是 连续 文件 ,链接 式 文件 或 索引 文件 
地 址 信息 
卷 指出 存储 文件 的 设备 
起 始 地 址 文件 在 辅 存 中 的 起 始 物理 地 址 (例如 在 磁盘 上 的 柱 面 、 磁 道 和 块 号 ) 
使 用 大 小 文件 的 当前 大 小 ,单位 为 字 节 、 字 或 块 


分 配 大 小 文件 的 最 大 大 小 
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续 表 
访问 控制 信息 
所 有 者 被 指定 为 控制 该 文件 的 用 户 。 所 有 者 可 以 授权 或 拒绝 其 他 用 户 的 访问 ,并 可 
以 改变 给 予 他 们 的 权限 
访问 信息 包括 每 个 授权 用 户 的 用 户 名 和 口令 
许可 的 行为 控制 读 、 写 执行 以 及 在 网 上 传送 
使 用 信息 
数据 创建 文件 第 一 次 放置 在 目录 中 的 时 间 
创建 者 身份 通常 是 当前 所 有 者 ,但 也 不 一 定 必须 是 当前 所 有 者 


最 后 一 次 读 访问 的 日 期 ”最 后 一 次 读 文件 的 日 期 

最 后 一 次 读 的 用 户 身 份 ”最 后 一 次 读 文件 的 用 户 

最 后 一 次 修改 的 日 期 最 后 一 次 修改 文件 的 日 期 

最 后 一 次 修改 者 的 身份 ”最 后 一 次 修改 文件 的 用 户 

最 后 一 次 备份 的 日 期 最 后 一 次 把 文件 备份 到 另 一 个 存储 介质 中 的 日 期 

当前 使 用 情况 有 关 当前 文件 的 活动 信息 ,如 打开 文件 的 进程 ,是 否 被 一 个 进程 锁定 ,文件 是 
否 在 主 存 中 被 修改 但 没有 在 磁盘 中 被 修改 ,等 等 


7.5.2 目录 结构 


目录 结构 的 组 织 关系 到 文件 系统 的 存 取 速 度 , 也 关系 到 文件 的 共享 性 和 安全 性 。 常 用 
的 目录 结构 形式 有 单 级 目录 \ 两 级 目录 和 多 级 目录 。 

1. 单 级 目录 

这 是 最 简单 的 目录 结构 。 在 整个 系统 中 只 建立 一 张 目 录 表 ,每 个 文件 占用 一 个 目录 项 。 
每 个 目录 项 包括 文件 名 、 物 理 地 址 和 文件 属性 ,另外 还 包括 表明 目录 项 是 否 空闲 的 状态 位 ， 
如 图 7-13 所 示 。 





























文件 名 物理 地 址 文件 属性 |。 状态 位 
文件 名 1 | 
文件 名 2 | 

图 7-13 单 级 目录 


单 级 目录 实现 简单 ,并 且 能 实现 目录 管理 的 基本 功能 一 一 按 名 存 取 。 但 是 它 存在 以 下 


平均 需 查找 N/2 个 目录 项 。 每 当 建立 一 个 新 文件 时 ,必须 先 检索 所 有 的 目录 项 ,以 保证 新 
文件 名 在 目录 中 是 唯一 的 。 

(2) 不 允许 重 名 。 在 多 道 程序 环境 下 必然 面临 着 重 名 问题 ,所 以 单 级 目录 不 适合 多 道 
环境 。 

(3) 不 便于 实现 文件 共享 。 单 级 目录 要 求 所 有 的 用 户 都 用 同一 个 名 字 来 访问 同一 文 
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件 , 而 用 户 通常 都 有 自己 的 命名 习惯 ,要 求 能 够 使 用 不 同 的 名 字 来 访问 一 个 文件 。 
2. 两 级 目录 


为 了 改变 单 级 目录 中 文件 命名 冲突 问题 和 提高 对 目录 表 的 搜索 速度 ,两 级 目录 结构 中 
为 每 一 个 用 户 建立 一 个 单独 的 用 户 文件 目录 (User File Directory, UFD) ,这些 文件 目录 由 
用 户 所 有 文件 的 文件 控制 块 组 成 。 在 系统 中 建立 一 个 主 文件 目录 (Master File Directory， 
MFD) ,在 MFD 中 每 个 用 户 占 用 一 个 目录 项 ,其 中 包括 用 户 名 、 目 录 大 小 、 控 制 方式 和 指向 
该 用 户 目录 文件 的 指针 。 

当 用 户 需要 自己 的 文件 目录 时 ,可 以 请 求 系统 为 自己 建立 一 个 用 户 文件 目录 ; 如 果 不 
需要 ,也 可 以 请 求 系统 管理 员 撤 销 。 当 用 户 想 建立 一 个 新 文件 时 ,系统 只 需 检 查 该 用 户 的 
UFD。 如 有 同名 文件 , 则 用 户 须 重新 为 新 文件 命名 ; 如 果 没 有 ,只 需 在 UFD 中 建立 一 个 新 
目录 项 , 填 人 新 文件 名 和 其 他 项 目 。 当 用 户 要 删除 一 个 文件 时 ,也 同样 从 自己 的 UFD 中 找 
出 指定 文件 的 目录 项 ,回收 该 文件 的 存储 空间 ,删除 该 目录 项 即 可 。 

在 两 级 目录 结构 中 ,可 以 允许 不 同 用 户 在 自己 的 目录 中 使 用 相同 的 文件 名 ; 相对 于 单 
级 目录 ,能 提高 检索 目录 的 速度 ; 也 可 以 使 不 同 的 用 户 用 不 同 的 文件 名 访问 同一 个 共享 文 
件 。 如 图 7-14 所 示 , 主 目录 中 的 两 个 用 户 Wang、Zhang 可 以 使 用 相同 的 文件 名 A. C 来 命 
名 不 同 的 文件 ,也 可 以 共享 文件 Editor。 


Wang 的 文件 目录 
目录 ang 的 文件 目录 



































六 一 | 文件 名 | 文件 属性 | 物理 始 址 
用 户 名 | 目录 大 小 | 访问 控制 信息 | 物理 始 址 AG 4 nc 
Wang oo “0 ge Editor , 
Zhang|  … es 2 Ei i Editor 
: 文 
件 
Zhang 的 文件 目录 大 
一 | 文件 名 | 文件 属性 | 物理 始 址 























A.C 
Editor | 





A.C( 同 名 ) 














7-14 两 级 目录 结构 


3. 多 级 目录 


为 了 更 清楚 地 反映 系统 中 众多 文件 的 不 同 用 途 , 也 为 了 更 方便 查找 文件 。 可 把 两 级 目 
录 的 层次 关系 加 以 扩充 ,而 形成 多 级 目录 结构 ,也 称 为 树 形 目 录 结 构 。 树 形 目录 结构 中 主 目 
录 称 为 根 目录 ,数据 文件 称 为 树叶 ,每 一 级 目录 称 为 树 的 节点 。 每 一 级 目录 中 的 目录 项 可 以 
是 一 个 文件 ,也 可 以 是 另 一 个 目录 。 如 图 7-15 所 示 , 图 中 方 框 代表 目录 文件 ,圆圈 代表 数据 
文件 ,数字 是 文件 的 内 部 标识 。 

在 树 形 目录 中 ,从 根 目 录 到 任何 数据 文件 都 只 有 一 条 唯一 的 通路 , 称 为 路 径 。 在 该 路 径 
上 ,从 树 的 根 开始 ,把 全 部 目录 文件 名 与 数据 文件 名 依次 用 */? 连 接 起 来 , 即 构成 该 数据 文件 
的 绝对 路 径 名 (absolute path name) 。 为 了 便于 用 户 对 文件 的 访问 ,可 为 每 一 个 进程 设置 一 
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图 7-15 多 级 目录 结构 


个 当前 目录 (current directory) ,又 称 工作 目录 ,进程 对 各 文件 的 访问 只 需 从 当前 目录 开始 ， 
逐 级 经 过 中 间 的 目录 文件 ,最 后 到 达 要 访问 的 数据 文件 ,把 这 一 路 径 名 称 为 相对 路 径 名 
(relative path name)。 例 如 ,用 户 B 的 文件 m( 标 号 为 27) 的 绝对 路 径 为 /B/F/C/m, 如 果 用 
户 B 的 当前 目录 是 /B/F, 则 文件 m 的 相对 路 径 是 C/m。 

在 树 形 目录 结构 中 ,用 户 可 为 自己 建立 UFD, 并 可 再 创建 子 目 录 。 而 在 删除 目录 时 ,由 
于 有 的 目录 中 还 存在 其 他 文件 ,可 采用 两 种 方法 加 以 处 理 。 一 种 方法 是 不 允许 直接 删除 非 
空 目录 ,要 删除 一 个 非 空 目录 ,必须 先 删除 目 录 中 的 所 有 文件 ,然后 才能 将 该 目录 删除 ; 另 
一 种 方法 是 删除 一 个 目录 的 同时 删除 其 中 的 所 有 子 目录 和 文件 。 第 二 种 方法 实现 简单 但 比 
较 危险 ,需要 有 相应 的 措施 进行 补救 。 


7.5.3 目录 管理 


1. 索引 节点 


文件 目录 通常 是 存放 在 磁盘 上 的 , 当 文件 很 多 时 ,文件 目录 可 能 要 占用 大 量 的 盘 块 。 在 
查找 文件 时 ,首先 把 存放 目录 文件 的 第 一 个 盘 块 调 入 内存 ,然后 把 用 户 所 给 的 文件 名 与 目录 
项 中 的 文件 名 一 一 进行 比较 ,如 果 未 找到 , 便 将 下 一 个 盘 块 中 的 目录 项 调 人 内 存 。 设 目录 文 
件 所 占用 的 盘 块 数 为 N, 按 此 方法 查找 ,找到 一 个 目录 项 平均 需要 调 人 盘 块 (N 二 1)/2 次 。 
假如 一 个 FCB 为 64B, 盘 块 大 小 为 IKB, 则 每 个 盘 块 中 只 能 存放 16 个 FCB; 若 一 个 文件 目 
录 共 有 640 个 文件 , 需 占 用 40 个 盘 块 , 则 平均 查找 一 个 文件 需 启 动 磁盘 20 次 。 

很 显然 ,在 查找 一 个 文件 的 时 候 , 要 用 它 的 文件 名 和 目录 文件 中 的 文件 名 进行 比较 ,也 
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就 是 说 ,检索 目录 文件 时 只 用 到 了 文件 名 ,而 其 他 一 些 信 息 是 不 需要 调 入 内 存 的 。 因 此 ,可 
以 把 文件 名 和 文件 描述 信息 分 开 , 把 文件 描述 信息 作为 一 个 单独 的 数据 结构 , 称 为 索引 节 
点 。(UNIX 系统 中 简称 为 1 节点 )。 文 件 目录 中 的 每 个 目录 项 仅 由 文件 名 和 指向 该 文件 所 
对 应 的 索引 节点 的 指针 所 构成 ,这 样 的 文件 目录 又 称 为 符号 文件 目录 (SFD)。 而 所 有 的 索 
引 节 点 构成 了 基本 文件 目录 (BFD)。 例 如 ,将 图 7-15 所 示 的 目录 结构 中 2 号 到 10 号 的 文 
件 用 基本 文件 目录 和 符号 文件 目录 表示 , 则 如 图 7-16 所 示 。 这 样 符号 文件 目录 所 占 的 字 节 
数 较 少 ,在 UNIX 系统 中 一 个 目录 仅 占 16B, 在 1KB 的 盘 块 中 可 以 存放 64 个 目录 项 ,拥有 
640 个 文件 的 文件 目录 只 需 占 用 10 个 盘 块 , 则 平均 查找 一 个 文件 启动 磁盘 的 次 数 减少 到 原 


来 的 1/4。 





二 | 空闲 文件 目录 
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图 7-16 采用 基本 文件 目录 表 的 多 级 目录 结构 


索引 节点 包括 磁盘 索引 节点 和 内 存 索引 节点 。 每 个 文件 有 唯一 的 一 个 磁盘 索引 节点 。 
当 文件 被 打开 时 ,要 将 磁盘 索引 节点 复制 到 内 存 中 ,成 为 内 存 索引 节点 。 表 7-2 列 出 了 磁盘 
索引 节点 和 内 存 索引 节点 的 内 容 。 


表 7-2 索引 节点 的 内 容 








磁盘 索引 节点 
文件 主 标识 符 拥有 该 文件 的 个 人 或 小 组 的 标识 符 
文件 类 型 包括 正规 文件 .目录 文件 和 特殊 文件 
文件 存 取 权 限 指 各 类 用 户 对 文件 的 存 取 权 限 
文件 物理 地 址 给 出 数据 文件 所 在 盘 块 的 编号 
文件 长 度 以 字 节 为 单位 的 文件 大 小 
文件 连接 计数 表明 在 本 文件 系统 中 所 有 指向 该 (文件 的 ) 文 件 名 的 指针 数 
文件 存 取 时 间 指出 本 文件 最 近 被 进程 存 取 的 时 间 、 最 近 被 修改 的 时 间 及 索引 节点 最 近 被 修改 


的 时 间 
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续 表 
内 存 索引 节点 (增加 的 内 容 ) 
索引 节点 编号 用 于 标识 内 存 索引 节点 
状态 指示 索引 节点 是 否 上 锁 或 被 修改 
访问 计数 每 当 有 一 个 进程 要 访问 此 索引 节点 时 ,将 该 访问 计数 加 1 ,访问 完 再 减 1 
链接 指针 设置 有 分 别 指向 空闲 链表 和 散 列 队列 的 指针 
2. 文件 的 存 取 


在 存 取 一 个 文件 时 ,必须 访问 多 级 目录 ,如 果 访 问 每 级 目录 时 都 必须 到 文件 存储 设备 上 
搜索 ,这 不 仅仅 大 大 浪费 CPU 的 处 理 时 间 , 而 且 还 给 输入 输出 设备 增加 了 不 应 有 的 负担 。 
解决 这 个 问题 的 一 种 方法 是 在 系统 初 启 时 把 所 有 的 目录 文件 读 入 内 存 , 这 种 方法 虽然 访问 
速度 快 ,但 是 需要 大 量 的 内 存 支持 。 另 一 种 方法 是 把 当前 正在 使 用 的 那些 文件 目录 表 目 复 
制 到 内 存 中 ,这 样 可 以 在 不 占 太 多 内 存 容量 的 情况 下 显著 减少 搜索 目录 的 时 间 和 输入 输出 
设备 的 压力 。 为 此 ,系统 提供 两 种 特殊 的 操作 把 当前 正在 使 用 的 那些 文件 目录 表 项 复制 到 
内 存 的 指定 区 域 ,以 及 当 用 户 不 需要 访问 有 关 的 文件 信息 时 删 去 有 关 目 录 在 内 存 中 的 副本 。 
这 两 种 操作 分 别 为 打开 文件 (fopen) 和 关闭 文件 (fclose)。 这 两 个 操作 一 般 以 系统 调用 的 方 
式 提供 给 用 户 。 

当 用 户 要 打开 一 个 文件 时 ,系统 首先 根据 用 户 给 定 的 文件 名 ,把 主 目录 MFD 中 与 待 打 
开 文 件 相 联系 的 有 关 表 目 复制 到 内 存 , 得 到 该 文件 对 应 的 索引 节点 的 指针 ,然后 将 该 文件 对 
应 的 索引 节点 复制 到 内 存 中 成 为 内 存 索引 节点 ,再 根据 索引 节点 中 记录 的 文件 的 物理 地 址 ， 
换算 出 文件 在 磁盘 上 的 物理 位 置 ; 最 后 再 通过 磁盘 驱动 程序 将 所 需 文 件 读 和 人 内存。 这 时 文 
件 已 被 打开 , 称 这 样 的 文件 为 打开 的 文件 或 活动 文件 。 

例如 ,用 户 准 备 打 开 图 7-16 中 的 文件 /A/a, 具 体 过 程 如 下 : 

(1) 首先 把 主 目录 文件 中 相应 的 表 目 , 即 第 一 项 A 复制 到 内 存 。 

(2) 根据 (1) 所 复制 得 到 的 标识 符 , 再 复制 此 标识 符 所 指明 的 基本 文件 目录 表 中 的 有 关 
表 目 , 即 图 7-16 中 id=3 的 BFD 表 目 项 。 

(3) 根据 (2) 所 得 到 的 子 目录 说 明 信 息 搜索 SFD, 以 找到 与 打开 文件 相对 应 的 目录 表 
项 , 即 索 引 节 点 的 指针 ,在 此 例 中 可 以 找到 文件 a 所 对 应 的 索引 节点 的 指针 id 二 6。 

(4) 根据 (3) 所 搜索 到 的 文件 名 所 对 应 的 标识 符 id, 把 相应 的 BFD 的 表 目 即 索引 节点 
复制 到 内 存 。 在 此 例 中 把 文件 a 的 其 他 信息 复制 到 内 存 中 ,系统 便 可 以 方便 地 找到 文件 a 
的 有 关 信 息 。 


C.6 文件 共享 和 保护 


现代 计算 机 系统 中 总 是 同时 存在 着 多 个 用 户 和 进程 ,这 些 用 户 和 进程 经 常 使 用 同一 个 
文件 ,如 果 每 个 用 户 都 要 在 系统 中 保存 一 份 同样 的 文件 的 副本 ,将 极 大 地 浪费 存储 空间 。 
此 操作 系统 必须 为 用 户 提供 文件 共享 的 手段 ,使 得 同样 的 文件 在 存储 设备 上 只 需要 保留 一 
份 副本 , 想 要 使 用 该 文件 的 用 户 可 以 以 自己 的 文件 名 去 访问 该 文件 的 副本 ,这 样 便 可 大 大 节 
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省 存储 空间 。 实 现 文件 共享 的 方法 有 很 多 种 ,如 绕道 法 、 链 接 法、 基于 索引 节点 的 方法 和 基 
于 符号 链接 的 方法 。 

绕道 法 要 求 每 个 用 户 在 当前 目录 下 工作 ,要 进行 文件 共享 时 ,用 户 从 当前 目录 出 发 向 上 
返回 到 与 所 要 共享 文件 所 在 路 径 的 交叉 点 ,再 顺序 下 访 到 共享 文件 。 显 然 ,绕道 法 要 绕 弯路 
访问 多 级 目录 ,从 而 搜索 效率 不 高 。 链 接 法 是 在 相应 目录 表 之 间 进 行 链接 ,即将 一 个 目录 中 
的 链 指针 直接 指向 被 共享 文件 所 在 的 目录 。 链 接 法 和 绕道 法 都 需要 用 户 指定 被 共享 的 文件 
和 被 链接 的 目录 。 

当前 常用 的 共享 方法 是 基于 索引 节点 的 方法 和 基于 符号 链 的 方法 。 


7.6.1 基于 索引 节点 的 共享 方法 


在 7.5 节 已 经 介绍 了 索引 节点 的 有 关内 容 。 为 了 便于 快速 查找 文件 和 文件 共享 ,系统 
把 除了 文件 名 以 外 的 其 他 属性 信息 放 在 索引 节点 中 ,并 且 在 索引 节点 中 设置 一 个 链接 计数 
count, 用 于 表示 链接 到 本 索引 节点 上 的 用 户 目录 项 的 数目 。 当 count=3 时 ,表示 有 3 个 用 
户 目 录 项 链接 到 本 文件 上 ,或 者 说 有 3 个 用 户 共 享 此 文件 。 

如 图 7-17 所 示 , 当 用 户 Wang 创建 一 个 新 文件 时 ,他 便 是 该 文件 的 所 有 者 ,此 时 将 
count 置 1。 当 有 用 户 Lee 要 共享 此 文件 时 ,在 用 户 Lee 的 目录 中 增加 一 个 目录 项 ,并 设置 
一 个 指针 指向 该 文件 的 索引 节点 ,此 时 文件 主 为 Wang,count 二 2。 此 时 若 用 户 Wang 不 再 
需要 此 文件 ,也 不 能 将 此 文件 删除 ,因为 删除 该 文件 会 使 用 户 Lee 的 指针 悬空 ,从 而 使 Lee 
正在 对 此 文件 上 执行 的 操作 半途 而 废 。 

Wang 的 用 户 文件 目录 





索引 节点 








十 
Testr 


count=2 ( ) 
i 文件 物理 地 址 


Testr 








Lee 的 用 户 文件 目录 


























7-17 ”基于 索引 节点 的 共享 方式 


7.6.2 基于 符号 链接 的 共享 方法 


如 果 目 录 B 想 要 共享 目录 C 的 文件 F, 则 由 系统 建立 一 个 LINK 类 型 的 新 文件 ,并 将 新 
文件 写 入 B 的 目录 中 ,新 文件 中 只 包含 F 的 路 径 名 , 当 B 要 访问 文件 F 时 ,操作 系统 根据 新 
文件 的 路 径 名 去 读 该 文件 .来 实现 用 户 B 对 文件 F 的 共享 。 新 文件 中 的 路 径 名 则 被 看 作 是 
符号 链接 (symbolic link) 。 

在 符号 链接 方式 中 ,符号 链接 文件 也 没有 指针 指向 被 链接 文件 的 索引 节点 ,符号 链接 文 
件 有 自己 的 索引 节点 和 文件 主 ( 即 建立 该 符号 链接 的 用 户 ) ,其 文件 类 型 为 符号 链接 文件 ,如 

































































图 7-18 所 示 。 
目录 /usr/joe 文件 /usr/joe/ha 
的 文件 内 容 文件 /usr/joe/ha 的 索引 节点 的 文件 内 容 
a 二 一 一 
pd 文件 类 型 , 普通 文件 | 一 一 | 人 
ha 引用 计数 为 1 站 
加 络 块 地 址 
目录 /usr/sue 文件 /usr/sue/qi 
的 文件 内 容 文件 /usr/sue/qi 的 索引 节点 的 文件 内 容 
a 文件 类 型， 符号 链接 文件 | | oe 
qi 引用 计数 为 1 
多 盘 块 地 址 

















图 7-18 基于 符号 链接 的 共享 方式 


在 建立 符号 链接 后 ,如 果 删 除 符号 链接 文件 , 则 被 链接 文件 不 受 任何 影响 ; 反之 ,在 符 
号 链接 文件 还 存在 时 , 若 要 删除 被 链接 文件 , 则 被 链接 文件 完全 删除 ,不 会 像 索 引 节点 方式 
那样 留 下 其 索引 节点 和 文件 内 容 。 此 后 , 若 通 过 符号 链接 访问 被 链接 文件 , 则 返回 一 个 “被 
链 文件 不 存在 ”的 错误 而 已 。 如 果 被 链接 文件 删除 后 ,在原 被 链接 文件 处 新 增 了 一 个 与 原 被 
链接 文件 同名 的 文件 , 则 符号 链接 将 会 访问 新 的 文件 。 总 之 ,符号 链接 文件 与 被 链接 文件 是 
相互 独立 的 。 

符号 链接 方式 还 有 一 个 最 大 的 优点 就 是 能 够 通过 网 络 链接 世界 上 任何 一 台 计算 机 中 的 
文件 或 目录 ,这 些 文件 和 目录 可 以 存在 ,也 可 以 不 存在 ,车 不 存在 ,操作 系统 向 用 户 返 回 “ 所 
链接 的 文件 不 存在 ”的 出 错 信 息 。 链 接 时 只 需 提 供 该 文件 所 在 计算 机 的 网 络 地 址 以 及 该 计 
算 机 中 的 文件 路 径 即 可 。 

符号 链接 方式 的 缺点 如 下 : 一 是 访问 时 有 可 能 需要 多 次 读 盘 ,增加 了 系统 的 开销 。 
为 其 他 用 户 共享 文件 时 ,系统 要 根据 给 定 的 文件 路 径 名 来 逐个 查找 记录 ,增加 了 启动 磁盘 的 
频率 。 二 是 给 每 个 用 户 建立 符号 链接 时 都 要 为 此 用 户 配置 一 个 索引 节点 ,要 耗费 一 定 的 磁 
盘 空 间 。 


7.6.3 文件 的 保护 


文件 保护 与 文件 共享 密切 相关 , 它 是 文件 共享 的 必然 需要 ,其 实质 是 实施 有 条 件 的 共 
享 。 一 个 用 户 建 立 的 文件 可 以 允许 其 他 用 户 共 享 ,也 可 以 不 允许 ,即使 是 获准 使 用 文件 的 用 
户 对 文件 的 操作 也 是 有 一 定 限制 的 ,例如 只 许 读 、 只 许 写 、 只 许 执行 、 可 读 写 等 。 因 此 ,操作 
系统 应 该 建立 安全 可 靠 的 保护 机 构 , 向 用 户 提供 保护 个 人 文件 的 必要 手段 。 文 件 保护 机 构 
的 基本 作用 是 : 防止 未 经 许可 的 用 户 访问 某 个 文件 ,限制 用 户 对 文件 的 存 取 权 限 , 防 止 对 文 
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件 的 误 操作 。 一 般 可 用 下 述 几 种 方法 来 实现 文件 的 保护 。 
1. 存 取 控 制 矩阵 


存 取 控制 矩阵 以 一 个 二 维 矩 阵 来 实现 存 取 控制 。 系 统 中 的 每 一 个 用 户 和 文件 都 在 存 取 
控制 矩阵 中 有 一 项 内 容 。 每 一 列 代表 一 个 文件 ,每 一 行 代表 一 个 用 户 , 行 和 列 交叉 的 地 方 则 
表示 用 户 对 文件 的 存 取 控制 权 , 包 括 读 (R)、 写 (W) 和 执行 (E), 如 图 7-19 所 示 。 当 用 户 向 
文件 系统 提出 存 取 要 求 时 ,由 存 取 控 制 验 证 模块 根据 该 矩阵 内 容 对 本 次 存 取 要 求 进行 比较 ， 
如 果 不 匹 配 ,系统 将 不 执行 。 














文件 名 
A B C 
Wang | RWE | Rw R | R 
用 户 Zhang | RWE | _RWE WE | Rw 
Liu E | R W | WwW 











图 7-19 存 取 控 制 矩 阵 
存 取 控 制 矩阵 容易 理解 ,实现 也 比较 简单 ,但 当 文 件 和 用 户 比较 多 时 , 存 取 控 制 矩阵 将 
会 占用 非常 大 的 内 存 空 间 , 并 且 使 存 取 文 件 时 进行 权限 验证 的 速度 变 得 十 分 缓慢 ,因此 实际 
上 一 般 都 采用 存 取 控 制 表 或 其 他 方式 来 实现 。 
2. 存 取 控 制 表 
系统 为 每 个 文件 在 其 FCB 中 设置 一 个 存 取 控 制 表 , 表 目 内 容 包括 用 户 身 份 识 别 以 及 用 
户 所 具有 的 存 取 权 限 。 为 了 避免 用 户 名 单 过 长 ,通常 采用 对 

















用 户 类 规定 存 取 权 限 的 方法 。 用 户 类 由 系统 或 文件 主 定义 ， | 。 用户 类 |“ 存 取 权 限 
并 赋予 特定 的 类 标识 符 , 在 进程 的 PCB 中 设 有 用 户 类 标识 字 a RWE 
段 。 按 这 种 方法 形成 的 存 取 控制 表 如 图 7-20 所 示 。 证 

当 用 户 提出 文件 存 取 要 求 时 ,由 存 取 控 制 验证 模块 根据 本 可 
文件 的 存 取 控制 表 的 内 容 对 本 次 存 取 要 求 进行 检查 ,如 果 不 下 加 Neone 











配 , 则 系统 拒绝 执行 。 当 文件 被 打开 时 , 存 取 控制 表 也 相应 地 被 
复制 到 内 存活 动 文件 中 ,因此 , 存 取 控制 验证 能 高 效 地 进行 。 


3. 口令 


图 7-20 存 取 控制 表 


口令 方式 有 两 种 。 一 种 是 当 用 户 进 入 系统 时 为 建立 终端 进程 时 获得 的 系统 使 用 权 口 
令 。 显 然 , 如 果 用 户 输入 的 口令 与 原来 设置 的 口令 不 一 致 , 该 用 户 将 被 系统 拒绝 。 另 一 种 是 
为 每 一 个 创建 的 文件 设置 一 个 口令 , 且 将 其 置 于 文件 说 明 中 。 当 任 一 用 户 想 使 用 该 文件 时 ， 
都 必须 提供 口令 。 只 有 当 口 令 相符 时 ,才能 允许 存 取 。 若 允许 其 他 用 户 使 用 自己 的 文件 , 口 
令 设 置 者 可 将 口令 交 给 其 他 用 户 。 这 样 , 既 可 以 做 到 文件 共享 ,又 可 以 做 到 保密 ; 而 且 口令 
较为 简单 ,占用 内 存单 元 少 ,验证 口令 所 费时 间 也 少 。 不 过 ,相对 来 说 ,口令 方式 保密 性 较 
差 。 口 令 一 旦 被 别人 掌握 ,就 可 以 获得 和 文件 主 同样 的 权限 。 再 者 , 当 要 修改 某 个 用 户 的 存 
取 权 限时 ,文件 主 必须 修改 口令 ,这 样 ,所 有 共享 用 户 的 存 取 权限 都 被 取消 ,除非 文件 主将 新 
口令 通知 用 户 。 
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4. 密码 方式 


在 用 户 创建 源 文件 并 将 其 写 人 存储 设备 时 对 文件 进行 加 密 , 在 读 出 文件 时 对 其 进行 解 
密 。 文 件 加 密 和 解密 都 需 用 户 提供 一 个 代码 键 。 加 密 程序 根据 这 一 代码 键 对 用 户 文件 进行 
编码 变换 ,然后 将 其 写 入 存储 设备 。 在 读 取 文件 时 ,只 有 用 户 给 定 的 代码 键 与 加 密 时 的 代码 
键 相 一 致 时 ,解密 程序 才能 对 加 密 文件 进行 解密 ,将 其 还 原 为 源 文件 。 加 密 和 解密 都 需要 耗 
费 处 理 机 的 时 间 。 


5. 其 他 方式 


除了 前 面 的 几 种 方式 之 外 ,现在 广泛 使 用 基于 物理 标志 的 身份 认证 技术 ,达到 对 文件 保 
护 的 目的 ,如 指纹 、 声 纹 、 眼 纹 等 。 指 纹 具 有 “物证 之 首 ” 的 美誉 ,利用 指纹 来 识别 身份 是 具有 
广阔 前 景 的 一 种 识别 技术 。 在 我 国 也 已 开发 出 嵌入 式 指纹 识别 系统 ,该 系统 利用 DSP( 数 
字 信 号 处 理 器 ) 芯 片 进行 图 像 处 理 ,并 可 将 指纹 的 录入 ,指纹 的 匹配 等 处 理 功能 全 部 集成 在 
仅 有 半 张 名 片 大 小 的 电路 板 上 。 指 纹 录入 的 数量 可 达 3500 枚 甚至 更 多 ,而 搜索 1000 枚 指 
纹 的 时 间 仅 需 1s。 指 纹 识别 系统 在 我 国 的 一 些 单位 已 经 获得 应 用 ,如 将 它 用 于 计算 机 登录 
系统 .身份 识别 系统 和 保管 箱 系统 中 。 


(3 磁盘 管理 与 调度 


在 过 去 的 几 十 年 中 ,处 理 器 速度 和 主 存 速 度 的 提高 远 远 超 过 了 磁盘 访问 速度 的 提高 。 
处 理 器 和 主 存 的 速度 提高 了 两 个 数量 级 ,而 磁盘 访问 的 速度 只 提高 了 一 个 数量 级 ,致使 磁盘 
的 访问 速度 与 主 存 访问 速度 的 差距 越 来 越 大 。 因 此 磁盘 存储 子 系统 的 性 能 至 关 重 要 。 目 前 
有 很 多 致力 于 此 方向 的 研究 。 本 节 主 要 介绍 磁盘 管理 的 一 些 关键 问题 ,包括 磁盘 性 能 、 磁 盘 
调度 和 磁盘 元 余 阵 列 。 


7.7.1 磁盘 性 能 简 述 


1. 磁盘 的 结构 


磁盘 表面 涂 有 磁性 材料 ,信息 通过 读 写 磁头 改变 磁盘 磁化 格式 而 存储 在 磁盘 表面 上 。 
记录 在 磁盘 上 的 信息 以 后 可 读 出 或 抹 掉 ,也 可 修改 。 磁 盘 的 上 下 两 面 都 可 读 写 。 若 干 盘 片 
装 在 磁盘 驱动 器 中 ,磁盘 驱动 器 由 带 有 读 写 头 的 磁头 璧 、 用 于 旋转 磁盘 的 轴 和 二 进 制 数据 输 
入 输出 所 需要 的 电子 设备 组 成 。 工 作 时 , 轴 带 动 磁盘 片 飞速 旋转 。 带 有 磁头 的 磁头 臂 通过 
移动 ,使 得 磁头 在 盘 片上 空 可 到 达 盘 片 的 任意 位 置 进 行 读 写 操作 。 磁 盘 片 上 的 数据 按 图 7-21 
所 示 的 方式 组 织 。 在 磁盘 上 划分 出 许多 同心 圆 , 称 为 磁道 (track) ,磁盘 的 每 面 可 分 为 上 千 
条 磁道 ,每 个 磁道 与 磁头 一 样 宽 , 磁 头 在 这 样 的 磁道 上 读 写 数据 。 磁 道 又 划分 为 若干 扇 区 
(sector) ,数据 存放 在 扇 区 这 样 的 块 中 。 为 加 强 磁头 对 位 和 避免 磁场 干扰 ,磁道 间 和 扇 区 间 
留 有 间隙 。 
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7-21 磁盘 数据 的 组 织 


2. 磁盘 数据 的 格式 


为 了 在 磁盘 上 存储 数据 ,必须 先 将 磁盘 格式 化 。 图 7-22 是 一 种 温 盘 ( 温 切 斯 特 磁盘 ) 中 
一 条 磁道 格式 化 的 情况 。 其 中 每 条 磁道 含有 30 个 固定 大 小 的 扇 区 ,每 个 扇 区 容量 为 600B， 
其 中 512B 存放 数据 ,其 余 的 用 于 存放 控制 信息 。 每 个 扇 区 包括 两 个 字段 ， 

(1) 标识 符 字 段 。 其 中 的 一 个 字 节 的 Synch 具有 特定 的 位 图 像 ,作为 该 字段 的 定 界 符 ， 
利用 磁道 号 、 磁 头号 及 扇 区 号 三 者 来 标识 一 个 扇 区 ; CRC 字段 用 于 段 校 验 。 

(2) 数据 字段 。 存 放 512B 的 数据 。 

















































































































月 区 物理 扁 区 0 物理 扁 区 1 5 物理 鹿 区 29 
1 1 1 1 1 
1 1 1 1 1 
ID Data 1D Data 1D Data 
Gap |Field| Gap |Field| Gap | Gap |Field| Gap |Field| Gap Gap IField| Gap |Field |Gap 
字 节 数 0 量 攻 吉本 马 攻 : 1 129|2|12913 
17 7 41 515 20 17 7 4 sis “20 17 7 41 515 20 
了 SS . \ 
了 和 7 
Pal 、、 Z 、\ 
600B 
Synch| Track| Head | Sector Synch 
Byte | # # # CRC Byte Data | CRC 
字 节 数 1 1 1 3 1 52 2 
7-22 ”磁盘 的 格式 
3. 磁盘 的 类 型 
1) 固定 头 磁盘 


这 种 磁盘 在 每 条 磁道 上 都 有 一 个 读 写 磁 头 ,所 有 的 磁头 都 被 装 在 一 个 刚性 磁 辟 上 。 通 
过 这 些 磁 头 可 访问 所 有 磁道 ,并 进行 并 行 读 写 , 有 效 地 提高 了 磁盘 的 1/O 速度 。 这 种 结构 
主要 用 于 大 容量 磁盘 上 。 

2) 移动 头 磁盘 

每 一 个 盘面 仅 配 有 一 个 磁头 ,也 被 装 在 磁 臂 上 。 为 能 访问 该 盘面 上 的 所 有 磁道 ,该 磁头 
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必须 能 移动 以 进行 寻 道 。 可 见 ,移动 磁头 仅 能 以 串 行 方式 读 写 ,致使 其 1/O 速度 较 慢 。 但 
由 于 其 结构 简单 , 故 仍 广泛 应 用 于 中 小 型 磁盘 设备 中 。 


4. 磁盘 访问 时 间 


1) 寻 道 时 间 

寻 道 时 间 T, 是 指 把 磁 臂 (磁头) 移动 到 指定 磁道 上 所 经 历 的 时 间 。 该 时 间 是 启动 磁 臂 
的 时 间 * 与 磁头 移动 条 磁道 所 花费 的 时 间 之 和 , 即 T= 二 mXn 十 s。 其 中 ,m 是 一 个 常数 ， 
与 磁盘 驱动 器 的 速度 有 关 , 对 一 般 磁盘 ,mm 一 0.2; 对 高 速 磁 盘 ,m 三 0. 1; 磁 臂 的 启动 时 间 约 
为 2ms。 这 样 ,对 一 般 的 温 盘 ,其 寻 道 时 间 将 随 寻 道 距离 的 增加 而 增 大 ,大 体 上 是 5 一 30ms。 

2) 旋转 延迟 时 间 

旋转 延迟 时 间 T. 是 指定 扇 区 移动 到 磁头 下 面 所 经 历 的 时 间 。 对 于 硬盘 ,典型 的 旋转 
速度 为 5400r/min, 每 转 需 时 11. 1ms, 平 均 旋转 延迟 时 间 T, 为 5. 55ms。 

3) 传输 时 间 

传输 时 间 全 ,是 指 把 数据 从 磁盘 读 出 或 向 磁盘 写 和 数据 所 经 历 的 时 间 。T, 的 大 小 与 每 
次 所 读 写 的 字 节 数 5 和 旋转 速度 有 关 : 

b 


T = 六 


其 中 ,r 为 磁盘 每 秒 的 转 数 ; N 为 一 条 磁道 上 的 字 节 数 , 当 一 次 读 写 的 字 节 数 相当 于 半 条 磁 
道上 的 字 节 数 时 ,TT 与 T, 相同 ,因此 ,可 将 访问 时 间 T, 表示 为 


ob 


ge 
开 一 下 十 去 十 六 


7.7.2 磁盘 调度 算法 


在 多 道 程序 环境 中 ,经 常会 有 多 个 进程 要 求 访问 磁盘 。 怎 么 样 才 能 使 各 进程 对 磁盘 的 
平均 访问 时 间 最 短 ? 需要 选择 一 种 好 的 调度 算法 。 从 前 面 的 内 容 可 知 , 寻 道 时 间 在 磁盘 访 
问 时 间 中 占 了 很 大 的 比例 ,因此 磁盘 调度 的 目标 是 使 磁盘 的 平均 寻 道 时 间 最 短 。 下 面 主要 
介绍 先 来 先 服务 、 最 短 寻 道 时 间 优 先 以 及 扫描 算法 。 


1. 先 来 先 服务 算法 


先 来 先 服务 (First Come First Served,FCFS) 调 度 算法 最 大 的 特点 就 是 公平 ,因为 每 个 
请 求 都 会 按照 收 到 的 顺序 进行 处 理 。 此 算法 的 缺点 是 没有 对 寻 道 进行 优化 ,致使 平均 寻 道 
时 间 可 能 过 长 。 所 以 此 算法 适用 于 请 求 I/O 的 进程 较 少 的 场合 。 图 7-23 显示 了 由 9 个 进 
程 先后 提出 磁盘 I/O 请 求 时 按照 FCFS 算法 进行 调度 的 情况 。 


2. 最 短 寻 道 时 间 优 先 算法 


最 短 寻 道 时 间 优 先 (Shortest Seek Time First,SSTF) 算 法 选择 使 磁头 臂 从 当前 位 置 开 
始 移动 最 少 的 磁盘 I/O 请 求 。 因 此 .SSTF 算法 总 是 选择 导致 最 小 寻 道 时 间 的 请 求 。 从 
图 7-24 可 以 看 出 ,SSTF 算法 的 平均 每 次 磁头 移动 距离 明显 低 于 FCFS 的 距离 ,因而 SSTF 
比 FCFS 有 更 好 的 寻 道 性 能 ,在 过 去 曾 被 广泛 采用 。 
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(从 100 号 磁道 开始 ) (从 100 号 磁道 开始 ) 
被 访问 的 下 一 个 移动 距离 被 访问 的 下 一 个 移动 距离 
磁道 号 (磁道 数 ) 磁道 号 (磁道 数 ) 
55 45 90 10 
58 3 58 32 
39 19 55 3 
18 21 39 16 
90 72 38 1 
160 70 18 20 
150 10 150 132 
38 112 160 10 
184 146 184 24 
平均 移动 距离 : 55.3 平均 移动 距离 : 27.5 
图 7-23 ” 先 来 先 服务 调度 算法 示例 图 7-24 最 短 寻 道 时 间 优 先 调度 算法 示例 
3. 扫描 算法 


SSTF 算法 虽然 能 获得 较 好 的 寻 道 性 能 ,但 却 可 能 导致 某 个 进程 发 生 * 饥 饿 ” 
(starvation) 现 象 。 因 为 只 要 不 断 有 新 进程 的 请 求 到 达 , 且 其 所 要 访问 的 磁道 与 磁头 当前 所 
在 磁道 的 距离 较 近 ,这 种 新 进程 的 I/O 请 求 必须 优先 满足 。 对 SSTF 算法 略 加 修改 后 所 形 
成 的 扫描 (Scan) 算 法 即 可 防止 老 进 程 出 现 “ 饥 饿 "现象 。 

扫描 算法 要 求 磁 头 臂 仅仅 沿 一 个 方向 移动 ,并 在 途中 满足 所 有 未 完成 的 请 求 , 直 到 它 到 
达 这 个 方向 上 的 最 后 一 个 磁道 ,或 者 在 这 个 方向 上 没有 别 的 请 求 为 止 ; 然后 倒转 服务 方向 ， 
沿 相反 方向 扫描 ,同样 按 顺 序 完 成 所 有 请 求 。 此 种 算法 磁头 移动 的 规律 颇 似 电梯 的 运行 , 因 
而 又 常 称 之 为 电梯 调度 算法 。 图 7-25 是 按照 扫描 算法 对 9 个 进程 进行 调度 以 及 磁头 移动 
的 情况 。 


4. 循环 扫描 算法 


扫描 算法 杜绝 了 饥饿 现象 .但 调度 性 能 仍 需 要 改善 。 假 设 请 求 对 磁道 的 分 布 是 均匀 的 ， 
在 扫描 算法 中 ,磁头 到 头 转向 时 , 近 磁 头 端的 请 求 很 少 ( 磁 头 刚刚 经 过 ) ,请 求 总 是 密集 分 布 
在 远离 磁头 的 一 端 ,而 这 些 请 求 等 待 的 时 间 却 要 长 一 些 。 由 此 提出 循环 扫描 算法 (Circular 
SCAN,CSCAN), 它 与 扫描 算法 相似 ,不 同 的 是 ,在 CSCAN 中 规定 磁头 只 能 朝 着 一 个 方向 
移动 ,磁头 到 头 掉头 后 不 是 立即 扫描 ,而 是 立即 回 到 起 点 再 重新 开始 扫描 ,归途 中 不 服务 。 
其 磁头 移动 的 情况 见 图 7-26。 

一 个 实际 系统 应 采用 何 种 调度 算法 以 及 采用 此 算法 的 调度 性 能 效果 如 何 ,取决 于 访 盘 
请 求 的 数量 和 类 型 .系统 采用 的 其 他 相关 技术 以 及 性 能 改善 和 代价 之 间 的 平衡 。 在 实际 系 
统 中 由 于 此 种 算法 简单 有 效 ,性价比 比较 好 , 故 相当 普遍 地 采用 SSTF 算法 。 扫 描 算 法 和 
CSCAN 算法 更 适合 于 磁盘 负担 重 的 系统 。 如 果 一 个 系统 的 磁盘 等 待 队 列 中 很 少 有 多 于 一 
个 的 访 盘 请 求 在 等 待 ,那么 所 有 的 算法 都 是 等 效 的 ,这 时 FCFS 便 是 最 好 的 算法 。 另 外 系统 
的 文件 分 配 技 术 在 很 大 程度 上 也 会 影响 访 盘 请 求 的 磁道 分 布 : 一 个 程序 在 读 写 连续 分 配 文 
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(从 100 号 磁道 开始 ， 向 磁道 号 增加 方向 (从 100 号 磁道 开始 ， 向 磁道 号 增加 的 方 
访问 ) 向 访问 ) 
被 访问 的 下 一 个 移动 距离 被 访问 的 下 一 个 移动 距离 
磁道 号 (磁道 数 ) 磁道 号 (磁道 数 ) 
150 50 150 50 
160 10 160 10 
184 24 184 24 
90 94 18 166 
58 32 38 20 
55 3 39 1 
39 16 55 16 
38 1 58 3 
18 20 90 32 
平均 移动 距离 : 27.8 平均 移动 距离 : 35.8 














图 7-25 扫描 调度 算法 示例 图 7-26 CSCAN 调度 算法 示例 


件 时 所 产生 的 访 盘 请 求 总 在 相同 或 相 邻 的 磁道 上 ,从 而 只 需 很 少 的 磁头 移动 ; 而 读 写 不 连续 
分 配 文件 (索引 文件 或 链接 式 文件 ) 所 产生 的 访 盘 请 求 总 是 分 散在 磁盘 各 处 ,从 而 需要 更 多 的 
磁头 移动 。 由 于 系统 情况 和 应 用 情况 千差万别 , 故 磁盘 调度 算法 也 是 在 不 停 地 修改 、 更 换 的 。 


C.8 Linux 文件 管理 


每 种 操作 系统 都 有 自己 独特 的 文件 系统 ,如 Windows 文件 系统 、UNIX 文件 系统 等 。 
文件 系统 包括 了 文件 的 组 织 结构 .处 理 文件 的 数据 结构 ,操作 文件 的 方法 等 。Linux 最 初 引 
进 的 是 Minix 文件 系统 ,但 Minix 文件 系统 有 较 大 的 局 限 性 。1992 年 4 月 Linux 又 推出 了 
EXT(EXTended file system) ,1993 年 推出 了 EXT2 文件 系统 。 目 前 主要 的 版 本 是 EXT4 。 
Linux 还 支持 多 种 其 他 操作 系统 的 文件 系统 ,例如 minix、hpfs、msdos、umsdos、iso、nfs、 
sysv、affs、ufs、efs 等 ,多 达 二 十 几 种 。Linux 的 虚拟 文件 系统 屏蔽 了 各 种 文件 系统 的 差别 ， 
为 处 理 各 种 不 同文 件 系 统 提供 了 统一 的 接口 。 


7.8.1 Linux 文件 系统 概论 
1. Linux 文件 系统 的 树 形 结构 


Linux 文件 系统 采用 了 多 级 目录 的 树 形 层次 结构 管理 文件 。 树 形 结构 的 最 上 层 是 根 目 
录 , 用 /表示 。 在 根 目 录 之 下 是 各 层 目 录 和 文件 。 在 每 层 目 录 中 可 以 包含 多 个 文件 或 下 一 级 
目录 。 每 个 目录 和 文件 都 有 由 多 个 字符 组 成 的 目录 名 或 文件 名 。 系 统 在 运行 中 通过 使 用 命 
令 或 系统 调用 进入 任何 一 层 目录 ,这 时 系统 所 处 的 目录 称 为 当前 目录 。 

Linux 使 用 两 种 方法 来 表示 文件 或 目录 的 位 置 : 绝对 路 径 和 相对 路 径 。 绝 对 路 径 是 从 
根 目录 开始 依次 指出 各 层 目录 的 名 字 , 它 们 之 间 用 /分 隔 , 如 /usr/include。 相 对 路 径 是 从 当 
前 目录 开始 ,指定 其 下 层 各 个 文件 及 目录 的 方法 ,如 系统 当前 目录 为 /usr, 则 绝对 路 径 /usr/ 
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bin/cc 就 可 表示 为 相对 路 径 bin/cc。Linux 的 一 个 目录 是 一 个 驻 留 在 磁盘 上 的 文件 , 称 为 
目录 文件 。 系 统 对 目录 文件 的 处 理 方法 与 一 般 文件 相同 。 目 录 由 若干 目录 项 组 成 ,每 个 目 
录 项 对 应 目录 中 的 一 个 文件 。 在 一 般 操作 系统 的 文件 系统 中 ,目录 项 由 文件 名 和 属性 、 位 
置 . 大 小 ,建立 或 修改 时 间 , 访 问 权 限 等 文件 控制 信息 目录 项 

组 成 。Linux 继承 了 UNIX, 它 把 文件 名 和 文件 控制 。 jn 证 点 号 文件 名 
信息 分 开 管理 ,文件 控制 信息 单独 组 成 一 个 称 为 i 节 三 编号 
点 (inode) 的 结构 体 。i 节点 实质 上 是 一 个 由 系统 管理 | yf 
的 “目录 项 ”"。 每 个 文件 对 应 一 个 i 节点 ,它们 有 唯一 
的 编号 , 称 为 i 节点 号 。Linux 的 目录 项 只 由 两 部 分 组 
成 : 文件 名 和 ji 节点 号 ,如 图 7-27 所 示 。 


2. Linux 文件 的 类 型 





























图 7-27 Linux 文件 系统 的 目录 项 


1) 普通 文件 

普通 文件 是 计算 机 用 户 和 操作 系统 用 于 存放 数据 ,程序 等 信息 的 文件 。 一 般 都 长 期 地 
存放 在 外 存储 器 (磁盘 、 磁 带 等 ) 中 。 普 通 文件 一 般 又 分 为 文本 文件 和 二 进 制 文件 。 

2) 目录 文件 

目录 文件 是 文件 系统 中 一 个 目录 所 包含 的 目录 项 组 成 的 文件 。 目 录 文 件 只 允许 系统 进 
行 修改 。 用 户 进程 可 以 读 取 目录 文件 ,但 不 能 对 它们 进行 修改 。 有 两 个 特殊 的 目录 项 ,“.” 
代表 目录 本 身 ,“.. ”表示 父 目 录 。 

3) 设备 文件 

设备 文件 是 与 IO 设备 连接 的 一 种 文件 ,分 为 字符 设备 文件 和 块 设备 文件 ,对 应 于 字 
符 设备 和 块 设备 。Linux 把 对 设备 的 I/O 作为 普通 文件 的 读 取 / 写 和 操作。 内核 提供 了 对 
设备 处 理 和 对 文件 处 理 的 统一 接口 。 每 一 种 1/O 设备 对 应 一 个 设备 文件 ,存放 在 /dev 目录 
中 ,例如 行 式 打印 机 对 应 /dev/lp。 

4) 管道 文件 

管道 文件 主要 用 于 在 进程 间 传递 数据 。 管 道 是 进程 间 传 递 数 据 的 “媒介 ”。 一 个 进程 数 
据 写 入 管道 的 一 端 , 男 一 个 进程 从 管道 男 一 端 读 取 数 据 。Linux 对 管道 的 操作 与 文件 操作 
相同 , 它 把 管道 作为 文件 进行 处 理 。 管 道 文件 又 称 先进 先 出 (FIFO) 文 件 。 

5) 链接 文件 

链接 文件 又 称 符号 链接 文件 , 它 提供 了 共享 文件 的 一 种 方法 。 链 接 文 件 不 通过 文件 名 
实现 文件 共享 ,而 是 通过 链接 文件 中 包含 的 指向 文件 的 指针 来 实现 对 文件 的 访问 。 普 通用 
户 可 以 建立 链接 文件 ,并 通过 其 指针 访问 所 指向 的 文件 。 使 用 链接 文件 可 以 访问 普通 文件 ， 
还 可 以 访问 目录 文件 和 不 具有 普通 文件 形态 的 其 他 文件 。 它 可 以 在 不 同 的 文件 系统 之 间 建 
立 链接 关系 。 

从 对 文件 内 容 处 理 的 角度 ,无 论 是 哪 种 类 型 的 文件 ,Linux 都 把 它们 看 作 无 结构 的 流 式 
文件 。 


3. Linux 文件 的 访问 权限 
为 了 保证 文件 信息 的 安全 ,Linux 设置 了 文件 保护 机 制 ,其 中 之 一 就 是 给 文件 都 设 定 了 
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一 定 的 访问 权限 。 当 文件 被 访问 时 ,系统 首先 检验 访问 者 的 权限 ,只 有 与 文件 的 访问 权限 相 
符 时 才 允 许 对 文件 进行 访问 。Linux 中 的 每 一 个 文件 都 归 某 所 有 者 ” 同 组 用 户 其 他 用 户 
个 特定 的 用 户 所 有 ,而 且 一 个 用 户 一 般 总 是 与 某 个 用 户 组 相 长 五 妆 入 可 了 江 本 次 
关 。Linux 对 文件 的 访问 设 定 了 3 级 权限 : 文件 所 有 者 ,与 行 行 行 
文件 所 有 者 同 组 的 用 户 、 其 他 用 户 。 对 文件 的 访问 主要 是 “ww XRWXRWX 

3 种 处 理 操作 : 读 取 、 写 入 和 执行 。3 级 访问 权限 和 3 种 处 理 ， 图 7-28 Linux 的 访问 权限 和 
操作 形成 了 9 种 情况 ,如 图 7-28 所 示 。 处 理 操作 的 组 合 


7.8.2 虚拟 文件 系统 


Linux 的 虚拟 文件 系统 (VEFS) 屏 项 了 各 种 文件 系统 的 差别 ,为 处 理 各 种 不 同文 件 系统 
提供 了 统一 的 接口 。 在 VFS 管理 下 ,Linux 不 但 能 够 读 写 各 种 不 同 的 文件 系统 ,而 且 还 实 
现 了 这 些 文件 系统 相互 的 访问 。 


1. VFS 的 工作 原理 


Linux 支持 的 各 种 实际 文件 系统 ,如 EXT2、minix、msdos、sysv 等 称 为 物理 文件 系统 。 
不 同 的 物理 文件 系统 具有 不 同 的 组 织 结构 和 不 同 的 处 理 方式 。 操 作 系统 必须 把 各 种 不 同 的 
物理 文件 系统 的 所 有 特性 进行 抽象 ,建立 一 个 面向 各 种 物理 文件 系统 的 转换 机 制 ,通过 这 个 
转换 机 制 ,把 各 种 不 同 的 物理 文件 系统 转换 为 一 个 具有 统一 共性 的 虚拟 文件 系统 。 这 种 转 
换 机 制 称 为 虚拟 文件 系统 转换 (virtual file system switch, VFS)。VFS 实际 上 向 Linux 内 
核 和 进程 提供 了 一 个 处 理 各 种 物理 文件 系统 的 公共 接口 ,通过 这 个 接口 使 得 不 同 的 物理 文 
件 系统 看 来 都 是 相同 的 ,如 图 7-29 所 示 。 
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虚拟 文件 系统 
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图 7-29 Linux 的 虚拟 文件 系统 VFS 


VFS 并 不 是 一 种 实际 的 文件 系统 。EXT4 等 物理 文件 系统 是 存在 于 外 存 空 间 的 ,而 
VFS 仅 存在 于 内 存 中 。VFS 在 系统 启动 时 建立 ,在 系统 关闭 时 消失 ,物理 文件 系统 则 长 期 
存在 于 外 存 。 在 VFS 中 包含 着 向 物理 文件 系统 转换 的 一 系列 数据 结构 ,如 VFS 超级 块 、 
VFS 的 i 节点 以 及 各 种 操作 函数 的 转换 入 口 。 
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2. 文件 系统 的 注册 


Linux 支持 的 文件 系统 必须 注册 后 才能 使 用 ,文件 系统 不 再 使 用 时 则 予以 注销 。 向 系 
统 内 核 注册 有 两 种 方式 : 一 种 是 在 系统 引导 时 在 VFS 中 注册 ,在 系统 关闭 时 注销 ; 另 一 种 
是 把 文件 系统 作为 可 装 件 模块 ,在 安装 时 在 VFS 中 注册 ,并 在 模块 印 载 时 注销 。 文 件 系统 
的 注册 由 VFS 中 的 注册 链表 进行 管理 。 每 个 注册 的 文件 系统 登记 在 file_system_type 结构 
体 中 ,file_system_type 结构 体 组 成 一 个 链表 , 称 为 注册 链表 。 


3. 文件 系统 的 安装 


文件 系统 除 在 VFS 中 注册 外 ,还 必须 安装 到 系统 中 。 要 安装 的 文件 系统 必须 已 经 存在 
于 外 存 磁 盘 空 间 上 ,每 个 文件 系统 占用 一 个 独立 的 磁盘 分 区 ,并 且 具 有 各 自 的 树 形 层次 结 
构 。 由 于 EXT 是 Linux 的 标准 文件 系统 ,所 以 系统 把 EXT 文件 系统 的 磁盘 分 区 作为 系统 
的 根 文件 系统 。EXT 以 外 的 文件 系统 则 安装 在 根 文件 系统 下 的 某 个 目录 下 ,成 为 系统 树 形 
结构 中 的 一 个 分 枝 。Linux 文件 系统 的 树 形 层次 结构 中 用 于 安装 其 他 文件 系统 的 目录 称 为 
安装 点 或 安装 目录 。 


7.8.3 EXT 文件 系统 
1. 文件 系统 的 构造 


文件 是 存储 在 块 设备 上 的 ,在 块 设备 中 文件 的 组 织 和 管理 是 以 物理 块 为 单位 的 ,物理 块 
是 块 设备 上 划分 的 大 小 相同 的 存储 区 域 ,如 磁盘 的 扇 区 。 当 文件 存储 在 块 设备 上 时 也 被 划 
分 成 与 物理 块 大 小 相等 的 迎 辑 块 。 文 件 在 存储 设备 中 是 由 一 系列 的 逮 辑 块 序列 组 成 的 。 一 
个 文件 系统 一 般 使 用 块 设备 上 的 一 个 独立 的 思 辑 分 区 。 在 文件 的 逻辑 分 区 中 除了 表示 文件 
内 容 的 逻辑 块 ( 称 为 数据 块 ) 外 ,还 设置 了 若干 包含 管理 和 控制 信息 的 逻辑 块 。Linux 文件 
系统 把 多 辑 分 区 划分 成 块 组 (block group) ,并 从 0 开始 依次 编号 。 每 个 块 组 中 包含 若干 数 
据 块 ,数据 块 中 就 是 目录 或 文件 内 容 。 块 组 中 包含 着 几 个 用 于 管理 和 控制 的 信息 块 : 超级 
块 .组 描述 符 表 、 块 位 示 图 i 节点 位 示 图 和 i 节点 表 。 


2. 超级 块 


超级 块 (super block) 是 用 来 描述 Linux 文件 系统 整体 信息 的 数据 结构 ,主要 描述 文件 
系统 的 目录 和 文件 的 静态 分 布 情况 ,以 及 描述 文件 系统 的 各 种 组 成 结构 的 尺寸 .数量 等 。 超 
级 块 对 于 文件 系统 的 维护 是 至 关 重 要 的 。 超 级 块 位 于 每 个 块 组 的 最 前 面 ,每 个 块 组 中 包含 
的 超级 块 内 容 是 相同 的 。 在 系统 运行 期 间 ,需要 把 超级 块 复制 到 内 存 的 超级 块 结构 中 。 只 
需 把 块 组 0 的 超级 块 读 人 内 存 , 其 他 块 组 的 超级 块 作为 备份 。 在 Linux 中 ,超级 块 内 容 见 
图 7-30。 


3. 组 描述 符 表 


组 描述 符 表 的 每 个 表 项 是 一 个 组 描述 符 , 如 图 7-31 所 示 。 组 描述 符 是 一 个 用 来 描述 一 
个 块 组 的 有 关 信息 。 
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图 7-30 EXT 文件 系统 结构 
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图 7-31 EXT 文件 系统 组 描述 符 


每 一 个 块 组 有 一 个 组 描述 符 , 所 有 的 组 描述 符 集中 在 一 起 依次 存放 ,形成 组 描述 符 表 。 
组 描述 符 表 中 的 组 描述 符 的 顺序 与 块 组 在 磁盘 上 的 顺序 对 应 。 组 描述 符 可 能 占用 多 个 物理 
块 。 具 有 相同 内 容 的 组 描述 符 表 放 在 每 个 块 组 中 作为 备份 。 


4. 块 位 示 图 


Linux 文件 系统 中 数据 块 的 使 用 状况 由 块 位 示 图 来 描述 。 每 个 块 组 都 有 一 个 块 位 示 

图 ,位 于 组 描述 符 表 之 后 ,用 来 描述 本 块 组 中 数据 块 的 使 用 状况 。 块 位 示 图 的 每 一 位 (bit) 

表示 一 个 数据 块 的 使 用 情况 ,为 1 表示 对 应 的 数据 块 已 占用 ,为 0 表示 数据 块 空闲 。 各 位 的 
顺序 与 块 组 中 数据 块 的 顺序 一 致 , 块 位 示 图 一 般 占 用 一 个 迎 辑 块 。 


5. 索引 节点 


在 Linux 文件 系统 中 索引 节点 是 基本 的 构件 , 它 表 示 文 件 系统 树 形 结构 的 节点 。 每 一 
个 节点 是 一 个 文件 或 目录 。Linux 文件 系统 中 的 每 个 文件 由 一 个 索引 节点 描述 , 且 只 能 由 
一 个 索引 节点 描述 。Linux 文件 系统 的 索引 节点 定义 为 struct ext_inode。 如 表 7-3 所 示 。 


表 7-3 索引 节点 结构 





成 员 项 意 义 





链接 到 描述 索引 节点 当前 状态 的 链表 
链接 到 超级 块 中 的 索引 节点 链表 


i_list 


sb_list 
i_dentry 链接 到 目录 项 
i_ino 索引 节点 号 
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MV 








续 表 
成 员 项 意 名 
i_count 索引 节点 的 引用 计数 
i_ mode 文件 访问 权限 
iuid 文件 所 有 者 的 用 户 标 识 
i_size 文件 大 小 ,以 字 节 为 单位 
i_atime 文件 最 后 一 次 访问 时 间 
ictime 索引 节点 最 后 修改 时 间 
i_mtime 文件 内 容 最 后 修改 时 间 
i_dtime 文件 删除 时 间 
i_gid 文件 的 用 户 组 标识 
ilinks_count 文件 的 链接 数 
iblocks 文件 所 占 块 数 
ifop 指向 文件 操作 函数 结构 体 
iflags 文件 系统 标志 
i_block[] 数据 块 指针 数组 
i_mapping 文件 缓存 地 址 映射 
i_mode 文件 的 打开 模式 
i_lock 自 旋 锁 


i_block[] 指 针 数 组 指向 文件 内 容 所 在 的 数据 块 。 如 图 7-32 所 示 ,i_block[] 数 组 共有 
15 个 指针 : 前 12 个 指针 直接 指向 数据 块 , 称 为 直接 块 指针 ; 第 13 个 指针 是 一 次 间接 块 指 
针 ; 第 14 个 指针 是 二 次 间接 块 指针 ; 第 15 个 指针 是 三 次 间接 块 指针 。 


EXT2 的 索引 节点 










































































































































































类 型 及 权限 
所 有 者 信息 
文件 尺寸 
时 间 信 息 证 | 
下 数据 
~[ 数据 
12 个 直接 块 指针 | 慎 广 数据 
广 [数据 
-次 间接 块 指针 J | 广 [ 数据 
-次 间接 块 指针 = 这 | ~ 让 后 
三 次 间接 块 指针 = 
间接 块 指 天 
| 一 [及 天 





























7-32 索引 节点 中 物理 块 指针 示意 图 


6. 索引 节点 表 和 索引 节点 位 图 


一 个 块 组 中 所 有 文件 的 索引 节点 形成 了 索引 节点 表 。 表 项 的 序号 就 是 索引 节点 号 。 索 
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引 节点 表 存 放 在 块 组 中 所 有 数据 块 之 前 。 索 引 节点 表 在 块 组 中 要 占用 几 个 逻辑 块 由 超级 块 
中 的 s_inodes_per_group 给 出 。 索 引 节点 位 示 图 反映 了 索引 节点 表 中 各 个 表 项 的 使 用 情 
况 , 它 的 一 位 (bit) 表 示 索 引 节点 表 的 一 个 表 项 , 若 某 位 为 1 表示 对 应 的 表 项 已 占用 ,为 0 表 
示 表 项 空闲 。 索 引 节点 位 示 图 也 装 和 人 一 个 高 速 缓存 中 。 


7. EXT 的 目录 结构 


在 EXT 中 ,目录 是 一 个 特殊 的 文件 , 称 为 目录 文件 。 在 目录 文件 中 ,目录 项 是 entry 结 
构 体 ,它们 前 后 连接 成 一 个 类 似 链 表 的 形式 ,如 图 7-33 所 示 。 

































































0 12 24 44 56 
2 [12[1T. 2T2T1T. 11 [20[10[ foundfiles [217[12[ 4 [home 
[文件 名 
文件 名 长 度 
目录 项 长 度 
索引 节点 号 
图 7-33 目录 结构 


7.8.4 文件 管理 和 操作 

对 于 系统 中 打开 的 文件 ,主要 从 两 个 方面 进行 管理 : 一 方面 是 由 系统 通过 系统 打开 文 
件 表 进 行 统一 管理 , 另 一 方面 是 由 进程 通过 私有 数据 结构 进行 管理 。 文 件 打开 后 要 进行 各 
种 操作 ,VFS 提供 了 面向 文件 操作 的 统一 接口 。 

1. 系统 打开 文件 表 

Linux 系统 内 核 把 所 有 进程 打开 的 文件 集中 管理 ,把 它们 组 成 系统 打开 文件 表 。 系 统 


打开 文件 表 是 一 个 双向 链表 , 它 的 每 个 表 项 (节点 ) 是 一 个 file 结构 , 称 为 文件 描述 符 , 其 中 
存放 着 一 个 已 打开 文件 的 管理 控制 信息 。 进 程 每 打开 一 个 文件 就 建立 一 个 file 结构 体 , 并 


把 它 加 入 到 系统 打开 文件 表 中 。 
全 局 变量 first_file 指向 系统 打开 文件 表 的 表 头 。 
struct file { 
mode_t f_mode; /* 文 件 的 打开 模式 * / 
loff_t f_pos; /* 文 件 的 当前 读 写 位 置 * / 
unsigned short f_flags; /* 文 件 操作 标志 */ 
unsigned short f_count; /* 共享 该 结构 体 的 计数 值 * / 


unsigned long f_reada, f_ramax, f_raend, f_ralen, f_rawin; 


struct file *f next, *f prev; /* 链接 前 后 节点 的 指针 */ 


struct fown_struct f_owner; /x*SIGI0 用 PIDx/ 

struct inode *f_inode; /* 指向 文件 对 应 的 索引 节点 */ 

struct file operations *f op; /* 指向 文件 操作 结构 体 的 指针 * / 

unsigned long f_version; /* 文 件 版 本 */ 

void * private data; /* 指向 与 文件 管理 模块 有 关 的 私有 数据 的 指针 * / 


}; 
各 函数 说 明 如 下 : 
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f_mode 是 文件 创建 或 打开 时 指定 的 文件 属性 ,包括 文件 操作 模式 和 访问 权限 ,例如 , 符 
号 常量 FMODE_READ 表示 读 ,FMODE_WRITE 表示 写 。 

f_pos 记载 文件 中 当前 读 写 处 理 所 在 的 字 节 位 置 ,相当 于 文件 内 部 的 一 个 位 置 指针 。 

f_flags 指定 了 文件 打开 后 的 处 理 方式 ,0O_RDONLY 表示 仅 为 读 操作 打开 文件 ,O_ 
WRONLY 表示 仅 为 写 操作 打开 文件 ,O_RDWR 表示 为 读 和 写 操 作 打开 文件 等 。 

f_count 记载 的 是 共享 该 file 结构 体 的 进程 的 数目 。 

f_inode 指向 文件 对 应 的 VFS 索引 节点 。 

f_op 指向 对 文件 进行 操作 的 函数 指针 集合 。 

file_operations 结构 通过 {_op 对 不 同文 件 系统 的 文件 调用 不 同 的 操作 函数 。 


2. 进程 的 文件 管理 


如 图 7-34 所 示 , 对 于 一 个 进程 打开 的 所 有 文件 ,由 进程 的 两 个 私有 结构 进行 管理 ,fs_ 
struct 结构 体 记 录 文件 系统 根 目录 和 当前 目录 ,files_struct 结构 体 包含 进程 的 打开 文件 表 。 


struct fs_struct { 



































































































































int count; /* 共享 此 结构 的 计数 值 * / 
unsigned short umask; /* 文 件 掩 码 */ 
struct inode * root, * pwd; /* 根 目录 和 当前 目录 索引 节点 指针 */ 
}; 
索引 节点 
fs_struct 担 
current task_struct count 录 
2 umask 
root 索引 节点 
pwd 上 一 一 | 当 
国人 前 
fs files_struct 最 
files | 一 count 
喜 引 | 节 占 
-| 系统 打开 文件 表 。 , 宕 下 节 二 
0 [rao 
1 {fd[1] | 一 一 [fmode 
文件 标识 号 4 ， file_operations 
站 , lseek 
255 [fa[255] Linode read 
fop Write 
file wa 











7-34 进程 的 文件 管理 


root 是 指向 当前 目录 所 在 的 文件 系统 的 根 目录 索引 节点 ,在 按照 绝对 路 径 访问 文件 时 
就 从 这 个 指针 开始 。 
pwd 是 指向 当前 目录 索引 节点 的 指针 ,相对 路 径 则 从 这 个 指针 开始 。 


# define NR_OPEN 256 

struct files_struct { 
int count; /* 共享 该 结构 体 的 计数 值 * / 
fd_set close_on exec; 
fd_set open fds; 
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struct file * fd[NR OPEN]; 
}; 
fd[] 的 每 个 元 素 是 一 个 指向 file 结构 体 的 指针 ,该 数组 称 为 进程 打开 文件 表 。 进 程 每 
打开 一 个 文件 时 ,就 建立 一 个 file 结构 体 , 并 加 入 到 系统 打开 文件 表 中 ,然后 把 该 file 结构 
体 的 首 地 址 写 入 fd[] 数 组 的 一 个 空闲 元 素 中 。 一 个 进程 所 有 打开 的 文件 都 记载 在 fd[ ] 数 
组 中 。fd[ ] 数 组 的 下 标 称 为 文件 标识 号 。 在 Linux 中 ,进程 使 用 文件 名 打开 一 个 文件 ,在 此 
之 后 对 文件 的 识别 就 不 再 使 用 文件 名 ,而 直接 使 用 文件 标识 号 。 在 系统 启动 时 文件 标识 号 
0、1.2 由 系统 分 配 : 0 为 标准 输入 设备 ,1 为 标准 输出 设备 ,2 为 标准 错误 输出 设备 。 

当 一 个 进程 通过 fork() 创 建 一 个 子 进程 后 , 子 进程 共享 父 进程 的 系统 打开 文件 表 , 父 子 
进程 的 系统 打开 文件 表 中 下 标 相 同 的 两 个 元 素 指 向 同一 个 file 结构 体 。 这 时 file 的 f_count 
计数 值 增 1。 

一 个 文件 可 以 被 某 个 进程 多 次 打开 ,每 次 都 分 配 一 个 file, 并 占用 该 进程 打开 文件 表 
fd[ 的 一 项 ,得 到 一 个 文件 标识 号 。 但 它们 的 file 结构 体 中 的 f_inode 都 指向 同一 个 索引 


3. 文件 操作 函数 


file 中 人 op 指向 的 file_operations 结构 体 是 面向 文件 进行 操作 的 接口 ,也 是 VFS 提供 
的 向 各 种 物理 文件 系统 的 文件 操作 函数 进行 转换 的 统一 接口 。 


struct file operations { 
int ( * lseek) (struct inode *, struct file *, off t, int); 
int ( * read) (struct inode *, struct file *, char *, int); 
int ( * write) (struct inode *, struct file *, const char *, int); 
int ( * readdir) (struct inode *, struct file *, void *, filldir t); 
int ( * select) (struct inode *, struct file *, int, select table * ); 
int ( * ioct1) (struct inode *, struct file *, unsigned int, unsigned long); 
int ( * mmap) (struct inode *, struct file *, struct vm area struct * ); 
int ( * open) (struct inode *, struct file *); 
void ( * release) (struct inode *, struct file * ); 
int (*fsync) (struct inode *, struct file *); 
int ( * fasync) (struct inode *, struct file *, int); 
int ( * check media change) (kdev_t dev); 
int ( * revalidate) (kdev_t dev); 


}; 


各 函数 说 明 如 下 : 

lseek(inode，file, offset,origin) 是 文件 定位 函数 ,用 于 改变 文件 内 部 位 置 指针 的 值 。 

read(inode,file,buffer,count) 是 读 文件 函数 . 读 取 inode 对 应 的 文件 ,count 指定 读 取 
的 字 节 数 , 读 取 的 数据 置信 以 buffer 为 首 址 的 内 存 区 域 。 

write(inode,file,buffer,count) 是 写 文件 函数 .把 内 存 缓冲 区 buffer 的 数据 写 入 inode 
对 应 的 文件 中 ,count 为 写 人 数据 的 字 节 数 。 

readdir(inode,file,dirent,count) 是 读 目 录 函 数 . 从 inode 对 应 的 目录 项 结构 体 dirent 
中 读 取 数据 。dirent 类 似 于 EXT2 文件 的 目录 项 结构 ext2_dir_entry。 
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select(inode, file,type,wait) 是 文件 读 写 检测 函数 ,检测 能 否 对 设备 进行 读 或 写 操作 。 
inode 和 file 指定 操作 对 象 的 设备 文件 ,type 指定 操作 类 型 : 

。 type 一 SEL_IN 为 从 设备 读 取 。 

。 type 二 SEL_OUT 为 向 设备 写 入 。 

当 wait 不 为 NULL 时 ,在 设备 可 以 利用 之 前 进程 等 待 。 

ioctl(inode, file,cmd,arg) 是 参数 变更 函数 ,用 于 对 设备 文件 的 某 些 参数 的 变更 。 

mmap(inode, file, vm_area) 是 文件 映射 函数 ,把 文件 的 一 部 分 映射 到 用 户 的 虚拟 内 存 
区 域 。vm_area 是 映射 文件 对 应 的 vm_area_struct 结构 体 。 

open(inode, file) 是 文件 打开 函数 ,用 于 在 进程 打开 一 个 文件 调用 。 该 操作 函数 应 该 属 
于 inode_operations 结构 ,把 它 置 于 file_operations 之 中 是 因为 通过 file 结构 体 更 便于 对 文 
件 进行 操作 。 

release(inode, file) 是 file 结构 体 释放 函数 , 当 file 结构 体 的 f_count 为 0 时 调用 此 函数 
释放 该 结构 体 。 

fsync(inode, file) 是 文件 同步 函数 , 当 文 件 在 缓冲 区 中 的 内 容 被 修改 时 ,调用 该 函数 把 
其 内 容 写 回 外 存 的 该 文件 中 。 

fasync(inode,file,on) 是 文件 异步 函数 ,用 于 终端 设备 和 网 络 套 接口 的 异步 I/O 操作 。 

check_media_change(dev) 是 媒体 检测 函数 ,检测 非 固定 连接 媒体 的 设备 是 否 已 发 生变 
更 , 若 已 变更 返回 值 为 1 ,无 变更 返回 值 为 0。 

revalidate(dev) 是 媒体 重 置 函数 , 当 非 固定 连接 媒体 设备 发 生变 更 时 ,调用 该 函数 重新 
设置 该 媒体 对 应 的 各 个 数据 结构 中 的 有 关 数 据 。 


习题 


1. 什么 是 文件 ? 什么 是 文件 系统 ? 

2. 什么 是 文件 的 物理 结构 ?什么 是 文件 的 逻辑 结构 ? 

3. 什么 是 顺序 文件 ?什么 是 索引 顺序 文件 ? 为 什么 在 索引 顺序 文件 中 查找 一 个 记录 
的 平均 搜索 时 间 小 于 在 顺序 文件 中 的 平均 搜索 时 间 ? 

4. 试 比 较 基 于 索引 节点 和 基于 符号 链接 的 文件 共享 方式 有 何 异 同 。 

5. 文件 的 保护 共有 几 种 方式 ? 各 有 什么 特点 ? 

6. 一 个 程序 刚刚 在 一 个 顺序 文件 中 读 取 第 1 个 记录 。 接 下 来 , 它 要 读 第 10 个 记录 。 
那么 这 个 程序 应 该 要 读 多 少 个 记录 才能 读 人 第 10 个 记录 ? 接 下 来 要 读 第 6 个 记录 , 则 该 程 
序 需要 访问 多 少 个 记录 才能 读 入 第 6 个 记录 ? 

7. 在 某 系 统 中 ,采用 连续 分 配 策略 ,假设 文件 从 下 面 指定 的 物理 地 址 开始 存储 (假设 块 
号 从 1 开始 ), 求 和 逻辑 块 相 对 应 的 物理 块 号 。 

(1) 起 始 物理 块 号 ,1000; 逻辑 块 号 ,12。 

(2) 起 始 物理 块 号 ,75; 逻辑 块 号 ,2000。 

(3) 起 始 物理 块 号 ,150; 逻辑 块 号 ,25。 

8. 一 个 文件 系统 使 用 大 小 为 256B 的 物理 块 。 每 个 文件 都 有 一 个 目录 项 给 出 了 文件 
名 ,第 1 个 块 的 位 置 .文件 的 长 度 和 最 后 一 块 的 位 置 。 假 设 目录 项 和 最 后 读 取 的 物理 块 已 经 
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在 主 存 中 。 在 下 面 的 各 种 情况 中 ,请 指出 在 一 个 使 用 连续 分 配 的 系统 中 ,为 了 访问 指定 的 
块 ,需要 读 多 少 个 物理 块 (包括 读 取 指定 的 块 )? 

(1) 最 后 读 的 块 号 ,100; 将 要 读 的 块 号 ,600。 

(2) 最 后 读 的 块 号 ,500; 将 要 读 的 块 号 ,200。 

(3) 最 后 读 的 块 号 ,20; 将 要 读 的 块 号 ,21。 

(4) 最 后 读 的 块 号 ,21; 将 要 读 的 块 号 ,20。 

9. 在 一 个 使 用 链接 分 配 的 系统 中 ,完成 同 第 8 题 相 同 的 问题 。 

10. 在 使 用 索引 分 配 的 系统 中 ,完成 同 第 8 题 相 同 的 问题 。 假 设 目 录 项 中 包括 第 一 个 
索引 块 (不 是 文件 中 的 第 一 个 块 ) 的 位 置 。 每 一 个 索引 块 包含 指向 127 个 文件 块 的 指针 和 一 
个 指向 下 一 个 索引 块 的 指针 。 除 了 最 后 读 的 块 外 ,假设 含有 指向 最 后 读 的 块 的 指针 的 索引 
块 也 在 内 存 中 ,但 是 内 存 中 没有 其 他 的 索引 块 。 

11. 为 一 个 由 只 能 使 用 顺序 访问 的 设备 (如 磁带 ) 实 现 文件 系统 ,使 用 哪 种 分 配方 案 
最 好 ? 

12. Linux 文件 系统 操作 函数 有 哪些 ? 





多 人 处理 机 系统 | 


从 计算 机 诞生 之 日 起 ,人 们 对 更 强 的 计算 能 力 无 穷尽 的 追求 驱使 着 计算 机 工业 的 不 断 
发 展 。ENIAC 可 以 完成 每 秒 300 次 的 运算 ,当时 比 任何 计算 器 都 快 1000 多 倍 , 但 是 人 们 并 
不 满足 。 现 在 有 比 ENIAC 快 数 百 万 倍 的 计算 机 ,但 是 还 有 对 计算 能 力 更 强 的 计算 机 的 需 
求 。 天 文学 家 正在 探索 宇宙 ,生物 科学 家 正在 试图 理解 人 类 基因 的 含义 ,航空 工程 师 致 力 于 
建造 更 安全 和 更 快速 的 飞机 ,而 所 有 这 一 切 都 需要 更 强 的 计算 能 力 。 然 而 ,即使 有 更 强 的 计 
算 能 力 , 仍 然 不 能 满足 上 面 的 需求 。 

过 去 的 解决 方案 是 提高 时 钟 频 率 。 但 是 ,现在 遇 到 对 时 钟 频率 的 限制 。 根 据 爱 因 斯 坦 
的 相对 论 ,电子 信号 的 速度 不 可 能 超过 光速 ,在 真空 中 大 约 是 30cm/ns, 而 在 铜 线 或 光纤 中 
大 约 是 20cm/ns。 在 10GHz 的 计算 机 中 ,信号 的 传输 距离 不 会 超过 2cm; 在 100GHz 的 计 
算 机 中 ,整个 传输 距离 最 长 为 2mm; 而 在 一 台 1THz (1000GHz) 的 计算 机 中 ,传输 距离 就 
不 足 100pnm 了 ,这 在 一 个 时 钟 周期 内 正好 让 信和 号 从 一 端 到 另 一 端 并 返回 。 

让 计算 机 变 得 越 来 越 小 是 可 能 的 ,但 是 会 遇 到 另 一 个 问题 : 功 耗 。 计 算 机 运行 得 越 快 ， 
产生 的 热量 就 越 多 ,而 计算 机 越 小 就 越 难 散 热 。 在 高 端 Pentium 系统 中 ,CPU 的 散热 器 已 
经 比 CPU 大 。 从 1MHz 到 1GHz 需要 的 是 更 好 的 芯片 制造 工艺 ,而 从 1GHz 到 1THz 则 需 
要 完全 不 同 的 方法 。 

为 了 获得 更 高 的 处 理 速度 ,一 种 方式 是 大 规模 使 用 并 行 计算 机 。 这 些 计 算 机 有 多 个 
CPU ,每 个 CPU 以 自己 的 时 钟 频率 运行 ,但 是 总 体 上 比 单个 CPU 的 计算 能 力 强 。 具 有 100 
个 CPU 的 系统 已 经 商业 化 了 。 在 未 来 ,可 能 会 建造 出 具有 百 万 个 CPU 的 系统 。 当 然 为 了 
获得 更 高 的 处 理 速 度 ,还 有 其 他 潜在 的 方式 ,如 生物 计算 机 ,但 在 本 章 中 主要 介绍 多 CPU 

在 计算 密集 型 的 数据 处 理 中 ,例如 天 气 预测 、 围 绕 机 辟 的 气流 建 模 和 世界 经 济 模拟 等 ， 
经 常 采用 高 度 并 行 计算 机 。 这 需要 多 个 CPU 同时 长 时 间 和 运行 。 本 章 讨论 的 多 处 理 机 系统 
广泛 地 应 用 于 解决 这 些 问题 以 及 在 其 他 科学 和 工程 领域 中 的 问题 。 

另 一 种 方式 是 通过 因特网 把 全 世界 多 台 计 算 机 连接 起 来 ,共同 处 理 大 型 的 科学 问题 。 
这 需要 计算 机 之 间 进 行 相互 通信 ,以便 共同 处 理 一 个 问题 。 这 需要 在 互联 技术 方面 做 大 量 
的 工作 ,而且 不 同 的 互联 技术 会 导致 不 同性 质 的 系统 以 及 不 同 的 软件 组 织 。 

电子 (或 光学 ) 部 件 之 间 的 通信 ,其 实质 是 它们 之 间 按 照 事 先 定义 好 的 二 进 制 位 串 发 送 
消息 。 其 差别 是 部 件 之 间 进 行 通信 时 所 涉及 的 时 间距 离 和 逻辑 组 织 。 多 处 理 机 系统 有 3 
种 模型 。 第 一 种 是 共享 存储 器 多 处 理 机 系统 ,该 系统 中 有 2 一 1000 个 CPU 通过 一 个 共享 存 
储 器 通信 ,如 图 8-1(a) 所 示 , 图 中 C 表示 CPU。 每 个 CPU 都 可 访问 整个 物理 存储 器 ,可 使 
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用 LOAD 和 STORE 指令 对 存储 单元 进行 读 写 ,访问 一 个 存储 器 单元 通常 需要 2 一 10ns, 实 
现 这 样 的 模型 通常 涉及 大 量 的 底层 消息 传递 ,这 些 消息 传递 对 于 程序 员 来 说 是 透明 的 。 

第 二 种 是 消息 传递 型 多 处 理 机 系统 ,如 图 8-1(b) 所 示 , 图 中 M 表示 存储 器 多 个 CPU- 
存储 器 通过 某 种 高 速 互连网 络 连接 在 一 起 。 每 个 存储 器 只 能 被 与 其 相连 的 CPU 访问 。 
CPU 之 间 通 过 互连网 络 发 送 消息 ,在 网 络 连接 良好 的 情况 下 ,发 送 一 条 短 消息 需要 10 一 
50ps, 由 于 该 系统 中 没有 全 局 共享 的 存储 器 ,这 比 共享 存储 器 多 处 理 机 系统 的 存储 器 访问 时 
间 长 。 与 共享 存储 器 多 处 理 机 系统 相 比 ,该 系统 容易 构建 ,但 是 编程 比较 困难 。 
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(a) 共享 存储 器 多 处 理 机 系统 (b) 消息 传递 型 多 处 理 机 系统 (c) 广 域 分 布 式 系统 


图 8-1 多 处 理 机 系统 的 3 种 模型 


第 三 种 是 广 域 分 布 式 系统 (distributed system) ,如 图 8-1(c) 所 示 , 所 有 的 计算 机 系统 都 
通过 一 个 广域网 (例如 因特网 ) 连 接 起 来 。 每 台 计 算 机 有 自己 的 存储 器 ,并 通过 消息 传递 与 
其 他 计算 机 进行 通信 。 与 消息 传递 型 多 处 理 机 系统 之 间 的 差别 是 ,该 系统 使 用 了 完整 的 计 
算 机 ,而 且 消息 传递 时 间 通 常 需要 10 一 100ms。 与 消息 传递 型 多 处 理 机 系统 使 用 的 紧密 耦 
合 系统 不 同 ,该 系统 使 用 松散 斐 合 的 方式 ,造成 消息 传递 的 延迟 较 大 。 这 3 种 模型 的 系统 在 
通信 延迟 上 各 不 相同 ,分 别 有 3 个 数量 级 的 差别 ,其 中 ,第 一 种 模型 的 通信 延迟 最 小 ,第 三 种 
模型 的 通信 延迟 最 大 。 

本 章 主要 有 3 个 部 分 ,分 别 对 应 图 8-1 的 前 两 个 模型 再 加 上 虚拟 化 技术 。 在 每 一 部 分 
中 ,首先 简要 地 介绍 相关 硬件 ,然后 讨论 与 这 种 系统 相关 的 操作 系统 。 每 种 系统 都 面临 着 不 
同 的 问题 并 且 需 要 不 同 的 解决 方法 。 


@.1 多 处 理 机 


在 共享 存储 器 多 处 理 机 (以 后 简称 为 多 处 理 机 ,multiprocessor) 中 ,两 个 或 更 多 的 CPU 
全 部 共享 访问 一 个 公用 的 RAM, 运 行 在 任何 一 个 CPU 上 的 程序 都 访问 一 个 普通 (通常 是 
分 页 ) 的 虚拟 地 址 空间 。 该 系统 唯一 特别 的 性 质 是 ,一 个 CPU 对 存储 器 字 (memory word) 
写 入 某 个 变量 的 值 , 然 后 再 读 回 该 变量 ,得 到 的 值 是 不 同 的 (因为 男 一 个 CPU 改写 了 它 )。 
通过 恰当 地 安排 CPU 访问 存储 器 的 顺序 ,可 以 实现 CPU 间 通 信 , 即 一 个 CPU 向 存储 器 写 
入 数据 后 , 另 一 个 CPU 再 读 取 这 些 数据 。 

多 处 理 机 操作 系统 的 功能 与 普通 的 操作 系统 相同 ,涉及 处 理 机 管理 ,存储 器 管理 ,文件 
系统 和 I/O 设备 管理 。 不 过 ,多 处 理 机 操作 系统 在 某 些 领 域 还 是 有 一 些 独特 的 性 质 ,包括 
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进程 同步 资源 管理 以 及 调度 。 下 面 首先 概要 地 介绍 多 处 理 机 的 硬件 ,然后 讨论 有 关 操 作 系 
统 的 问题 。 


8.1.1 多 处 理 机 硬件 


多 处 理 机 的 共性 为 每 个 CPU 可 访问 全 部 存储 器 ,而 有 些 多 处 理 机 还 有 一 些 其 他 的 特 
性 。 例 如 , 读 出 每 个 存储 器 字 的 速度 一 样 快 的 处 理 机 称 为 UMA (Uniform Memory 
Access, 一 致 存储 器 访问 ) 多 处 理 机 ,相反 ,NUMA (Nonuniform Memory Access, 非 一 致 存 
储 器 访问 ) 多 处 理 机 不 具备 这 种 特性 。 


1. 基于 总 线 的 UMA 多 处 理 机 体系 结构 


最 简单 的 多 处 理 机 是 基于 单 总 线 的 ,如 图 8-2(a) 所 示 。 两 个 或 多 个 CPU 和 一 个 或 多 个 
存储 器 都 使 用 同一 个 总 线 进 行 通信 。 当 某 个 CPU 需要 读 一 个 存储 器 字 时 , 它 首先 检查 总 
线 是 否 忙 ,如果 总 线 空闲 ,该 CPU 把 所 需 存 储 器 字 的 地 址 放 到 总 线 上 ,发 出 若干 控制 信和 号， 
然后 等 待 存储 器 把 所 需 的 字 放 到 总 线 上 。 当 某 个 CPU 需要 读 写 存 储 器 时 ,如 果 总 线 忙 ， 
CPU 只 是 等 待 ,直到 总 线 空 闲 。 这 种 设计 存在 问题 。 在 只 有 少数 CPU 时 ,对 总 线 的 竞争 还 
可 以 管理 ; 当 有 32 个 或 64 个 CPU 时 ,就 不 能 有 效 地 实现 对 总 线 的 管理 。 这 种 系统 完全 受 
到 总 线 带宽 的 限制 ,多 数 CPU 在 大 部 分 时 间 里 是 空闲 的 。 

解决 该 问题 的 方案 是 为 每 个 CPU 添加 一 个 高 速 缓存 (cache) ,如 图 8-2(b) 所 示 。 其 中 
高 速 缓存 可 以 位 于 CPU 芯片 的 内 部 .CPU 附近 、 处 理 器 板 上 或 这 3 种 方式 的 组 合 。 























































































































私有 私有 
存储 器 | 存储 中 
共享 存储 器 共享 存储 器 
后 高 速 级 存 享 存储 器 a 
| C Cc 
C C 
C G M ] [ M 口 口 让 
I 
(a) 没有 高 速 缓存 (b) 有 高 速 缓存 (ec) 有 高 速 缓存 与 私有 存储 器 


图 8-2 UMA 多 处 理 机 系统 


由 于 许多 读 操作 可 以 从 本 地 高 速 缓存 上 得 到 满足 ,总 线 流量 会 大 大 减少 ,这 样 系统 就 能 
够 支持 更 多 的 CPU。 其 中 ,高速 缓 存 不 以 单个 字 为 基础 ,而 是 以 32B 或 64B 块 为 基础 。 当 
引用 一 个 字 时 , 它 所 在 的 整个 数据 块 被 取 到 使 用 它 的 CPU 的 高 速 缓存 当中 。 

每 个 高 速 缓存 行 或 者 被 标记 为 只 读 ( 在 这 种 情况 下 ,其 中 的 数据 块 同时 存在 于 多 个 高 速 
缓存 中 ) ,或 者 标记 为 读 写 ( 在 这 种 情况 下 ,其 中 的 数据 块 不 能 在 其 他 高 速 缓存 中 存在 )。 如 
果 CPU 试图 在 一 个 或 多 个 远程 高 速 缓存 中 写 入 一 个 字 , 总 线 硬件 检测 到 写 , 并 把 信号 放 到 
总 线 上 通知 所 有 其 他 的 高 速 缓存 。 如 果 其 他 高 速 缓存 有 一 个 “干净 ”的 副本 , 即 与 存储 器 内 
容 完全 一 样 的 副本 ,那么 它们 可 以 丢弃 该 副本 并 让 写 者 在 修改 之 前 从 存储 器 取出 高 速 缓存 
行 。 如 果 某 些 其 他 高 速 缓存 有 “ 脏 ”( 被 修改 过 ) 的 副本 , 它 必须 在 处 理 写 之 前 把 数据 写 回 存 
储 器 或 者 把 它 通过 总 线 直接 传送 给 写 者 。 高 速 缓 存 的 这 套 规 则 被 称 为 高 速 缓 存 一 致 性 协 
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议 , 它 是 诸多 协议 之 一 。 

还 有 一 种 基于 总 线 的 UMA 多 处 理 机 体系 结构 ,如 图 8-2(c) 所 示 , 在 该 结构 中 每 个 
CPU 不 仅 有 一 个 高 速 缓存 ,还 有 一 个 私有 存储 器 ,CPU 通过 一 条 专门 的 (私有 ) 总 线 访问 其 
私有 存储 器 。 编 译 器 把 所 有 程序 的 代码 ,字符 串 、 常 量 以 及 其 他 只 读数 据 、 栈 和 局 部 变量 放 
进 私有 存储 器 中 ,而 共享 存储 器 只 用 于 可 写 的 共享 变量 。 在 多 数 情况 下 ,该 方案 能 极 大 地 减 
少 总 线 流量 ,但 是 这 样 做 需要 编译 器 的 配合 。 


2. 使 用 交叉 开关 的 UMA 多 处 理 机 





在 基于 总 线 的 UMA 多 处 理 机 体系 结构 中 ,即使 有 最 好 的 高 速 缓存 ,CPU 的 数量 仍然 
被 限制 在 16 一 32 个 。 如 果 要 超过 这 个 数量 ,就 需要 不 同类 型 的 互连网 络 。 如 图 8-3 所 示 ， 
采用 最 简单 的 交叉 开关 电路 把 个 CPU 连接 到 个 存储 器 ,其 中 交叉 开关 把 一 组 进 线 以 任 
意 方式 连接 到 一 组 出 线 上 ,这 在 电话 交换 系统 中 已 经 采用 了 几 十 年 。 
存储 器 
0 | 1 0 1 
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(a) 8X8 交 又 开关 (b) 打开 的 交叉 点 (©) 闭合 的 交叉 点 
图 8-3 8X8 的 交叉 开关 





水 平 线 ( 进 线 ) 和 垂直 线 ( 出 线 ) 的 每 个 相交 位 置 上 是 一 个 交叉 点 (crosspoint) 。 交 叉 点 
是 一 个 电子 开关 ,开关 是 否 闭 合 取决 于 水 平 线 和 垂直 线 是 否 需 要 连接 。 在 图 8-3(a) 中 有 
3 个 交叉 点 同时 闭合 ,允许 3 个 (CPU ,存储 器 ) 对 (010,000)、(101,101) 和 (110,010) 同 时 连 
接 。 当 然 还 可 以 有 其 他 的 连接 。 其 实 ,可 能 连接 的 组 合 数 等 于 国际 象棋 上 8 个 棋子 安全 放 
置 方式 的 数量 ( 八 皇 后 问题 ) 。 

交叉 开关 的 优点 是 它 是 一 个 非 阻塞 网 络 ,不 会 因 有 些 交 叉 点 或 连 线 已 经 被 占据 了 而 拒 
绝 其 他 连接 (假设 存储 器 模块 自身 是 可 用 的 ) ,而 且 并 不 需要 预先 规划 。 即 使 已 经 设置 了 7 
个 任意 的 连接 ,还 有 可 能 把 剩余 的 CPU 连接 到 剩余 的 存储 器 上 。 

当然 , 当 两 个 CPU 同时 试图 访问 同一 个 存储 器 的 时 候 , 存 在 对 内 存 竞争 的 可 能 。 如 果 
将 内 存 分 为 个 单元 ,那么 与 图 8-2 的 模型 相 比 ,这 样 竞争 的 概率 可 以 降 至 1/n。 

交叉 开关 的 缺点 是 交叉 点 的 数量 以 n? 方式 增长 。 若 有 1000 个 CPU 和 1000 个 存储 
器 ,就 需要 一 百 万 个 交叉 点 。 这 样 的 数量 是 不 可 行 的 。 不 过 ,对 于 中 等 规模 的 系统 而 言 , 采 
用 该 设计 是 可 行 的 。 
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3. 使 用 多 级 交换 的 UMA 多 处 理 机 


另 一 种 完全 不 同 的 多 处 理 机 设计 是 基于 简单 的 2X2 开关 ,如 图 8-4(a) 所 示 。 该 开关 有 
两 个 输入 和 两 个 输出 ,到达 任意 一 个 输入 线 的 消息 可 以 被 交换 至 任意 一 个 输出 线 上 ,消息 由 
4 个 部 分 组 成 ,如 图 8-4(b) 所 示 。 其 中 ,Module( 模 块 ) 域 指明 使 用 哪个 存储 器 ; Address( 地 
址 ) 域 指定 在 模块 中 的 地 址 ; Opcode( 操 作 码 ) 域 给 定 了 操作 ,如 READ 或 WRITE; Value 
( 值 ) 域 是 可 选 的 ,该 域 中 可 包含 一 个 操作 数 , 例 如 一 个 要 被 WRITE 操作 写 入 的 32 位 字 。 
该 开关 检查 Module 域 并 利用 它 确定 消息 是 应 该 发 送 给 X 还 是 发 送 给 Y。 


A 人 | 
B |_y Module Address Opcode Value | 
i J 


(a) 一 个 2X2 的 开关 (b) 消息 格式 
图 8-4 简单 的 2X2 开关 及 其 消息 格式 























2X2 开关 有 多 种 使 用 方式 ,用 来 构建 大 型 的 多 级 交换 网 络 。 其 中 ,Omega 网 络 是 一 种 
简单 经 济 的 使 用 方式 ,如 图 8-5 所 示 。 这 里 采用 12 个 开关 ,把 8 个 CPU 连接 到 8 个 存储 器 
上 。 推 而 广 之 ,对 于 nn 个 CPU 和 nn 个 存储 器 ,将 需要 logs n 级 ,每 级 有 n/2 个 开关 ,总 数 为 
(n/2)logs n 个 开关 。 特 别 是 当 值 很 大 时 , 比 ni? 个 交叉 点 要 少 得 多 。 

假设 CPU 011 打算 从 存储 器 模块 110 读 取 一 个 字 ,CPU 发 送 READ 消息 给 开关 1D， 
它 在 Module 域 包含 110,1D 开关 取 110 的 首位 (最 左 位 ) 并 用 它 进行 路 由 处 理 。0 路 由 到 上 
端 输出 ,而 1 路 由 到 下 端 ,由 于 该 位 为 1, 所 以 消息 通过 下 端 输出 被 路 由 到 2D。 所 有 的 第 二 
级 开关 ,包括 2D, 取 第 二 个 比特 位 进行 路 由 。 该 位 还 是 1, 所 以 消息 通过 下 端 输出 转发 到 
3D。 在 这 里 对 第 三 位 进行 测试 ,结果 发 现 是 0。 于 是 ,消息 送 往 上 端 输出 ,并 达到 所 期 望 的 
存储 器 110。 该 消息 的 路 径 在 图 8-5 中 用 字母 a 标 出 。 

在 消息 通过 交换 网 络 之 后 ,模块 号 的 左 端 位 就 不 需要 了 。 但 是 它们 有 很 好 的 用 途 , 可 以 
用 来 记录 入 线 编号 ,这样 ,应 答 消息 可 以 找到 返回 路 径 。 对 于 路 径 a, 入 线 编号 110 只 要 从 
右 向 左 读 出 每 位 即 可 。 与 此 同时 ,CPU 001 需要 向 存储 器 001 里 写 入 一 个 字 , 与 上 面 的 情 
况 类 似 , 消 息 分 别 通过 上 端 \ 上 端 \ 下 端 输出 ,用 字母 b 标 出 。 当 消息 到 达 时 ,从 Module 域 
读 出 001, 代 表 了 对 应 的 路 径 。 由 于 这 两 个 请 求 不 使 用 相同 的 开关 、 连 线 和 存储 器 模块 ,所 
以 它们 可 以 并 行 工 作 。 

如 果 现 在 CPU 000 也 同时 请 求 访问 存储 器 模块 000 ,那么 该 请 求 会 与 CPU 001 的 请 求 
在 开关 3A 处 发 生 冲 突 , 其 中 的 一 个 请 求 就 必须 等 待 。 和 交叉 开关 不 同 ,Omega 网 络 是 一 种 
阻塞 网 络 ,并 不 是 每 一 个 请 求 都 可 以 并 行 处 理 。 冲 突 可 能 发 生 在 一 条 连 线 或 一 个 开关 处 ,也 
可 能 在 存储 器 的 请 求 和 来 自 存储 器 的 应 答 中 发 生 。 

显然 ,在 多 个 模块 间 均 匀 、 分 散 地 对 存储 器 进行 引用 是 必要 的 。 经 常 把 低位 作为 模块 
号 。 例 如 ,经 常 访问 32 位 的 计算 机 中 面向 字 节 的 地 址 空间 ,低位 通常 是 00, 但 接 下 来 的 3 位 
会 均匀 分 布 。 将 3 位 作为 模块 号 ,连续 的 字 会 放 在 连续 的 模块 中 。 而 连续 的 字 被 放 在 不 同 
的 模块 里 的 存储 器 系统 被 称 为 交错 (interleaved) 存 储 器 系统 。 交 错 存 储 器 将 并 行 运行 的 效 
率 最 大 化 ,这 是 因为 多 数 对 存储 器 的 引用 是 连续 编 址 的 。 可 以 设计 非 阻塞 的 交换 网 络 ,在 这 
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图 8-5 Omega 交换 网 络 
种 网 络 中 ,提供 了 多 条 从 每 个 CPU 到 每 个 存储 器 的 路 径 , 从 而 可 以 更 好 地 分 散 流量 。 
4. NUMA 多 处 理 机 


单 总 线 UMA 多 处 理 机 通常 不 超过 几 十 个 CPU ,而 交叉 开关 或 交换 网 络 多 处 理 机 需要 
其 他 更 多 ( 晶 贵 ) 的 硬件 ,所 以 规模 也 不 大 。 若 超过 100 个 CPU 还 必须 做 些 让 步 , 即 所 有 存 
储 器 模块 都 具有 相同 的 访问 时 间 。 这 导致 NUMA 多 处 理 机 的 出 现 。 与 UMA 相同 的 是 ， 
NUMA 为 所 有 的 CPU 提供 了 统一 的 地 址 空间 ,但 不 同 的 是 ,访问 本 地 存储 器 模块 比 访问 
远程 存储 器 模块 速度 快 。 因 此 ,在 NUMA 系统 上 运行 的 所 有 UMA 程序 无 须 做 任何 改变 ， 
但 在 相同 的 时 钟 速率 下 其 性 能 不 如 UMA 系统 。 

所 有 NUMA 系统 都 具有 以 下 3 种 关键 特性 : 

(1) 所 有 CPU 都 有 可 见 的 单个 地 址 空间 。 

(2) 通过 LOAD 和 STORE 指令 访问 远程 存储 器 。 

(3) 访问 远程 存储 器 比 访问 本 地 存储 器 慢 。 

在 NUMA 系统 中 , 若 没 有 高 速 缓 存 ,系统 被 称 为 NC-NUMA(No Cache NUMA ,无 高 
速 缓存 NUMA); 若 有 一 致 性 高 速 缓存 ,系统 被 称 为 CC-NUMA(Cache-Coherent NUMA， 
一 致 性 高 速 缓存 NUMA) 。 

目前 构造 大 型 CC-NUMA 多 处 理 机 最 常见 的 方法 是 基于 目录 的 多 处 理 机 (directory- 
based multiprocessor) 。 其 基本 思想 是 维护 一 个 数据 库 来 记录 高 速 缓存 行 的 位 置 及 其 状态 。 
当 一 个 高 速 缓存 行 被 引用 时 ,就 查询 数据 库 找 出 高 速 缓存 行 的 位 置 以 及 它 是 “干净 ”的 还 是 
“ 脏 ” 的 。 由 于 每 条 访问 存储 器 的 指令 都 必须 查询 这 个 数据 库 , 所 以 必须 有 相应 的 极 高 速 的 
专用 硬件 支持 ,使 其 在 一 个 总 线 周期 的 几 分 之 一 内 做 出 响应 。 
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假如 ,一 个 256B 的 系统 ,每 个 字 节 包含 一 个 CPU 和 通过 局 部 总 线 连接 到 CPU 上 的 
16MB 的 RAM。 整 个 存储 器 有 22B, 被 划分 为 2 个 64B 大 小 的 高 速 缓存 行 。 存 储 器 被 静 
态 地 在 节点 间 分 配 ,节点 0 是 0 一 16MB, 节 点 1 是 16 一 32MB, 以 此 类 推 。 节 点 通过 互连网 
络 连接 ,如 图 8-6(a) 所 示 。 每 个 节点 还 有 用 于 构成 其 24B 存储 器 的 28 个 64B 高 速 缓存 行 
的 目录 项 。 假 定 一 行 最 多 被 一 个 高 速 缓存 使 用 。 

为 了 了 解 目录 的 工作 原理 ,假设 引用 一 个 高 速 缓存 行 发 自 CPU 20 的 LOAD 指令 。 首 
先 发 出 该 指令 的 CPU 把 它 交 给 自己 的 内 存 管理 单元 (Memory Management Unit, MMU)， 
被 翻译 成 物理 地 址 ,例如 0X24000108, MMU 将 这 个 地 址 拆 分 为 3 个 部 分 ,如 图 8-6Cb) 所 
示 。 这 3 部 分 按 十 进 制 是 节点 36、 第 4 行 和 偏 移 量 8。MMU 看 到 引用 的 存储 器 字 来 自 节 
点 36, 而 不 是 节点 20, 所 以 它 把 请 求 消息 通过 互连网 络 发 送 到 该 高 速 缓存 行 的 主 节点 
(home node)36 上 ,询问 第 4 行 是 否 被 高 速 缓存 ,如 果 是 ,高 速 缓存 在 何 处 ? 

节点 0 节点 1 节点 255 
CPU 存储 器 CPU 存储 器 CPU ”存储 器 
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(b) 32 位 存储 器 地 址 划分 的 域 (0) 节点 36 中 的 目录 


图 8-6 基于 目录 的 多 处 理 机 系统 


当 请 求 通过 互连网 络 到 达 节 点 36 时 , 它 被 路 由 至 目录 硬件 。 硬 件 检索 其 包含 2* 个 表 
项 的 目录 表 ( 其 中 的 每 个 表 项 代表 一 个 高 速 缓存 行 ) 并 解析 到 目录 项 4。 从 图 8-6(c) 中 可 知 
该 行 没有 被 高 速 缓存 ,所 以 硬件 从 本 地 RAM 中 取出 第 4 行 , 送 回 节点 20, 更 新 目录 项 4, 指 
出 该 行 目前 被 高 速 缓存 在 节点 20 处 。 

若 第 二 个 请 求 访问 节点 36 的 第 2 行 。 在 图 8-6(c) 中 ,可 知 该 行 在 节点 82 处 被 高 速 组 
存 。 此 时 硬件 可 以 更 新 目录 项 2, 指 出 该 行 现在 在 节点 20 上 ,然后 发 送 一 条 消息 给 节点 82， 
指示 把 该 行 传 给 节点 20 并 使 其 自身 的 高 速 缓存 无 效 。 由 此 可 知 ,共享 存储 器 多 处 理 机 的 下 
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层 有 大 量 的 消息 传递 。 

假设 每 个 节点 有 16MB 的 RAM, 并 且 有 2 个 9 位 的 目录 项 记录 该 RAM。 这 样 目 录 
占用 RAM 的 开销 是 0.28125MB(9X2*/2”) 除 以 16MB, 即 约 1.76% ,一 般 而 言 是 可 接受 
的 (尽管 这 些 都 是 高 速 存 储 器 ,会 增加 成 本 )。 即 使 对 于 32B 的 高 速 缓存 行 ,开销 也 只 有 
4%; 对 于 128B 的 高 速 缓存 行 , 它 的 开销 不 到 1%。 

该 设计 存在 一 个 明显 的 缺陷 , 即 一 行 只 能 被 一 个 节点 高 速 缓存 。 若 允许 一 行 能 够 在 多 
个 节点 上 被 高 速 缓存 ,需要 对 所 有 行进 行 定 位 。 


5. 多 核 芯 片 


随 着 芯片 制造 技术 的 发 展 , 晶 体 管 的 体积 越 来 越 小 ,一 个 芯片 中 放 入 的 晶体 管 数量 越 来 
越 多 。 例 如 ,Intel Core 2 Duo 系列 芯片 已 包含 了 3 亿 数 量 级 的 晶体 管 。 

如 何 有 效 地 利用 这 些 晶体 管 ?” 一 个 选择 是 给 芯片 添加 兆 字 节 的 高 速 缓存 ,例如 , 带 有 
4MB 片上 高 速 缓存 的 芯片 现在 已 经 很 常见 ,并 且 带 有 更 多 片上 高 速 缓存 的 芯片 也 即将 出 
现 , 但 是 到 了 某 种 程度 ,增加 高 速 缓存 的 大 小 只 能 将 命中 率 从 99% 提 高 到 99.5% ,而 这 样 的 
改进 并 不 能 显著 提升 应 用 的 性 能 。 

另 一 个 选择 是 将 两 个 或 者 多 个 完整 的 CPU( 通 常 称 为 核 ,core) 集 成 到 同一 个 芯片 上 。 
双核 和 四 核 的 芯片 已 经 普及 ,80 核 的 芯片 已 经 被 制造 出 来 ,而 带 有 上 百 个 核 的 芯片 也 即将 
出 现 。 

虽然 CPU 可 能 共享 也 可 能 不 共享 高 速 缓存 ,但 是 它们 都 共享 内 存 。 每 个 内 存 字 有 唯 
一 的 值 。 特 殊 的 硬件 电路 可 以 确保 以 下 过 程 : 若 一 个 字 同 时 出 现在 两 个 或 者 多 个 高 速 缓存 
中 , 当 其 中 某 个 CPU 修改 了 该 字 , 所 有 其 他 高 速 缓 存 中 相应 的 字 都 会 被 自动 地 并 且 原 子 性 
地 删除 以 确保 一 致 性 ,该 过 程 称 为 窥探 (snooping) 。 

多 核 芯 片 被 称 为 片 级 多 处 理 机 (Chip-level MultiProcessors,CMP) 。 从 软件 的 角度 来 
看 ,CMP 与 基于 总 线 的 多 处 理 机 和 使 用 交换 网 络 的 多 处 理 机 并 没有 太 大 的 差别 。 不 过 , 它 
们 之 间 还 是 存在 着 若干 差别 。 例 如 ,对 基于 总 线 的 多 处 理 机 ,每 个 CPU 拥有 自己 的 高 速 组 
存 , 如 图 8-2(b) 所 示 。 在 共享 缓存 的 CMP 中 ,如 果 一 个 CPU 需要 很 多 高 速 缓存 空间 ,而 另 
一 个 CPU 不 需要 ,这样 就 允许 它们 各 自 使 用 所 需 的 高 速 缓存 。 但 另 一 方面 ,共享 高 速 缓存 
也 可 能 让 一 个 贪 禁 的 CPU 损害 其 他 CPU 的 性 能 。 

CMP 与 其 他 多 处 理 机 制 之 间 的 另 一 个 差别 是 容错 。 因 为 CPU 之 间 的 连接 非常 紧密 ， 
一 个 共享 模块 的 失效 可 能 导致 多 个 CPU 同时 出 错 。 而 该 情况 在 传统 的 多 处 理 机 中 是 很 少 
出 现 的 。 

除了 所 有 核 都 是 对 等 的 对 称 多 核 芯片 之 外 ,还 有 一 类 多 核 芯 片 被 称 为 片上 系统 (system 
on a chip) 。 这 些 芯 片 含 有 一 个 或 多 个 主 CPU, 但 是 同时 还 包含 若干 个 专用 核 , 例 如 音频 与 
视频 解码 器 ,加密 芯 片 和 网 络 接口 等 。 这 些 核 共同 构成 了 完整 的 片上 计算 机 系统 。 

通常 ,硬件 的 发 展 领先 于 软件 。 多 核 的 时 代 已 经 来 临 ,但 是 大 部 分 程序 员 还 不 具备 为 它 
们 编写 应 用 程序 的 能 力 。 现 有 的 编写 语言 并 不 适应 编写 高 度 并 行 的 代码 ,同时 缺乏 适用 的 
编译 器 和 调试 工具 。 有 编写 并 行程 序 经 验 的 程序 员 很 少 , 而 且 大 部 分 程序 员 对 于 如 何 将 工 
作 划 分 为 若干 可 以 并 行 执行 的 块 (package) 知 之 甚 少 。 同 步 、 消 除 竞 争 、. 避 免 死 锁 成 为 程序 
员 编 程 的 难点 。 同 时 ,信号 量 (semaphore) 并 不 能 解决 所 有 问题 。 除 了 这 些 问 题 外 ,目前 还 
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尚 不 明确 需要 使 用 数 百 核 的 具体 应 用 是 哪些 。 自 然 语 言语 音 识 别 可 能 需要 大 量 的 计算 ,但 
是 这 里 的 问题 并 不 是 缺少 时 钟 周期 ,而 是 缺少 可 行 的 算法 。 


8.1.2 多 处 理 机 操作 系统 类 型 


本 节 介 绍 多 处 理 机 软件 ,特别 是 多 处 理 机 操作 系统 。 主 要 介绍 3 种 类 型 的 多 处 理 机 操 
作 系 统 ,这 些 多 处 理 机 操作 系统 除了 适用 于 多 核 系统 之 外 ,同样 适用 于 包含 多 个 分 离 CPU 
的 系统 。 


1. 每 个 CPU 有 自己 的 操作 系统 

该 模型 采用 尽 可 能 最 简单 的 方法 组 织 多 处 理 机 操作 系统 ,静态 地 把 存储 器 划分 成 和 
CPU 一 样 多 的 部 分 ,为 每 个 CPU 提供 其 私有 存储 器 以 及 操作 系统 的 私有 副本 ,如 图 8-7 所 
示 。 该 方法 实际 上 是 个 CPU 以 个 独立 计算 机 的 形式 运行 ,其 优点 是 允许 所 有 的 CPU 
共享 操作 系统 的 代码 ,而 且 只 需要 提供 数据 的 私有 副本 。 

























































































CPU 1 CPU2 CPU3 CPU 4 存储 器 IO 
数据 
有 损 作 系统 | | 有 操作 系统 | 。 | 有 操作 系统 | 。 | 有 操作 系统 |。 昌 扣 
的 私有 副本 | “| 的 私有 副本 | “| 的 私有 副本 的 私有 副本 本 作 系 颖 加 
pe 


图 8-7 拥有 私有 存储 器 及 操作 系统 的 多 处 理 机 模型 


该 模型 比 n 个 分 离 的 计算 机 更 有 优势 ,因为 它 允 许 所 有 的 操作 系统 共享 一 套 磁盘 及 其 
他 的 1/O 设备 ,还 允许 灵活 地 共享 存储 器 。 即 便 使 用 静态 内 存 分 配 ,一 个 CPU 也 可 以 获得 
极 大 的 一 块 内 存 , 从 而 可 以 高 效 地 执行 代码 。 另 外 ,由 于 生产 者 能 够 直接 把 数据 写 入 存储 
器 ,从 而 使 得 消费 者 可 以 从 生产 者 写 入 的 位 置 取 出 数据 ,因此 进程 之 间 可 以 高 效 地 通信 。 况 
且 , 从 操作 系统 的 角度 看 ,每 个 CPU 都 有 自己 的 操作 系统 非常 自然 。 

该 模型 的 缺点 主要 涉及 4 个 方面 : 

(1) 当 一 个 进程 进行 系统 调用 时 ,该 系统 调用 是 在 本 机 的 CPU 上 被 捕获 并 处 理 的 ,并 
使 用 本 机 的 操作 系统 表 中 的 数据 结构 。 

(2) 因为 每 个 操作 系统 都 有 自己 的 表 , 那 么 它 也 有 自己 的 进程 集合 ,通过 自身 调度 这 些 
进程 。 如 果 一 个 用 户 登 录 的 是 CPU 1, 那 么 他 的 所 有 进程 都 在 CPU 1 上 和 运行。 因此 ,在 
CPU 1 有 负载 运行 而 CPU 2 空 载 的 情形 是 会 发 生 的 。 

(3) 没有 页 面 共享 ,会 出 现 如 下 的 情形 : 在 CPU 2 不 断 地 进行 页 面 调度 时 ,CPU 1 却 有 
多 余 的 页 面 。 由 于 内 存 分 配 是 固定 的 ,所 以 CPU 2 无 法 向 CPU 1 借用 页 面 。 

(4) 最 坏 的 情形 是 ,在 操作 系统 维护 近期 使 用 过 的 磁盘 块 的 缓冲 区 高 速 缓 存 时 ,每 个 操 
作 系 统 都 独自 进行 这 种 维护 工作 ,因此 可 能 出 现 某 一 修改 过 的 磁盘 块 同时 存在 于 多 个 缓冲 
区 高 速 缓 存 中 的 情况 ,这 将 导致 不 一 致 的 结果 。 避 免 这 一 问题 的 唯一 途径 是 取消 缓冲 区 高 
速 缓存 ,但 是 这 会 显著 降低 性 能 。 
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2. 主 从 多 处 理 机 


主 从 多 处 理 机 模型 如 图 8-8 所 示 。 在 该 模型 中 ,操作 系统 的 一 个 副本 及 其 数据 表 都 在 
CPU 1 上 ,而 不 在 其 他 CPU 上 。 为 了 在 CPU 1 上 进行 处 理 , 所 有 的 系统 调用 都 重 定向 到 
CPU 1 上 。 如 果 有 剩余 的 CPU 时 间 , 还 可 以 在 CPU 1 上 和 运行 用 户 进程 ,该 模型 称 为 主 从 
(master-slave) 模 型 , 即 CPU 1 是 主 CPU ,其 他 都 是 从 属 CPU 。 








CPU1 CPU2 CPU3 CPU4 存储 器 lo 
-机 运行 从 机 从 机 从 机 用 户 进程 
下 人 明生 | | 运行 用 户 | 。 | 运行 用 户 运行 用 户 二 
es 进程 进程 进程 操作 系统 
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图 8-8 主 从 多 处 理 机 模型 


该 模型 解决 了 第 一 种 模型 的 多 个 问题 。 该 模型 有 单一 的 数据 结构 (如 一 个 链表 或 者 一 
组 优先 级 链表 ) 用 来 记录 就 绪 进 程 。 当 某 个 CPU 空闲 时 , 它 向 CPU 1 上 的 操作 系统 请 求 一 
个 进程 运行 ,并 被 分 配 一 个 进程 。 这 样 ,就 不 会 出 现 一 个 CPU 空闲 而 另 一 个 过 载 的 情形 。 
类 似 地 ,可 在 所 有 的 进程 中 动态 地 分 配 页 面 ,而 且 只 有 一 个 缓冲 区 高 速 缓存 ,所 以 绝 不 会 出 
现 不 一 致 的 情形 。 

该 模型 的 问题 是 ,如 果 有 很 多 的 CPU , 主 CPU 会 变 成 一 个 瓶 项 。 毕 竟 , 主 CPU 要 处 理 
来 自 所 有 CPU 的 系统 调用 。 如 果 全 部 时 间 的 10% 用 来 处 理 系 统 调用 ,那么 10 个 CPU 就 
会 使 主 CPU 饱和 ,而 20 个 CPU 就 会 使 主 CPU 彻底 过 载 。 该 模型 对 小 型 多 处 理 机 是 可 行 
的 ,但 不 能 用 于 大 型 多 处 理 机 。 


3. 对 称 多 处 理 机 
































对 称 多 处 理 机 (Symmetric MultiProcessor, SMP) 模 型 如 图 8-9 所 示 , 它 消除 了 不 对 称 
性 。 在 存储 器 中 有 操作 系统 的 一 个 副本 ,但 任何 CPU 都 可 以 运行 它 。 在 有 系统 调用 时 , 进 
行 系统 调用 的 CPU 同时 陷入 内 核 并 处 理 系统 调用 。 





































































































CPUI1 CPU2 CPU3 CPU4 存储 器 VO 
运行 用 户 运行 用 户 运行 用 户 运行 用 户 
进程 和 操 进程 和 操 进程 和 操 进程 和 操 
作 系 统 作 系统 作 系 统 作 系 统 OS 加 
总 线 锁 


图 8-9 对 称 多 处 理 机 模型 


因为 该 模型 只 有 一 套 操作 系统 数据 表 , 所 以 它 能 够 动态 地 平衡 进程 和 存储 器 。 同 时 , 因 
为 不 存在 主 CPU , 它 还 消除 了 主 CPU 的 瓶颈 。 但 是 该 模型 也 有 自身 的 问题 ,特别 是 当 两 个 
或 更 多 的 CPU 同时 运行 操作 系统 代码 时 ,就 会 出 现 灾 难 。 例 如 ,有 两 个 CPU 同时 选择 相 
同 的 进程 运行 或 请 求 同 一 个 空闲 存储 器 页 面 。 处 理 这 些 问 题 的 最 简单 的 方法 是 在 操作 系统 
中 使 用 互 斥 信号 量 ( 锁 ) ,使 整个 系统 成 为 一 个 大 临界 区 。 当 一 个 CPU 要 运行 操作 系统 时 ， 
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它 必 须 首先 获得 互 斥 信号 量 。 如 果 互 斥 信 号 量 被 锁 住 ,就 得 等 待 。 按 照 这 种 方式 ,任何 
CPU 都 可 以 运行 操作 系统 ,但 在 任 一 时 刻 只 有 一 个 CPU 可 以 运行 操作 系统 。 

该 模型 是 可 以 工作 的 ,但 是 它 几 乎 同 主 从 模式 一 样 , 如 果 所 有 时 间 的 10%% 花 费 在 系统 
调用 上 ,那么 有 20 个 CPU 时 ,会 出 现 CPU 等 待 队列 。 由 于 操作 系统 中 的 很 多 部 分 是 彼此 
独立 的 ,可 以 对 该 情况 进行 改进 。 例 如 , 当 第 一 个 CPU 运行 调度 程序 时 ,第 二 个 CPU 则 处 
理 文件 系统 的 调用 ,第 三 个 CPU 可 以 处 理 一 个 缺 页 异常 。 

这 需要 把 操作 系统 分 割 成 互 不 影响 的 临界 区 ,每 个 临界 区 由 其 互 斥 信号 量 保护 ,每 次 只 
有 一 个 CPU 可 执行 它 。 采 用 该 方式 ,可 以 实现 更 多 的 并 行 操作 。 例 如 ,在 调度 时 需要 进程 
表 , 在 系统 fork() 调 用 和 信号 处 理 时 也 都 需要 进程 表 。 多 临界 区 使 用 的 每 个 表 都 需要 有 各 
自 的 互 斥 信号 量 。 通 过 这 种 方式 ,可 以 做 到 每 个 临界 区 在 任 一 时 刻 只 被 一 个 CPU 执行 ,而 
且 在 任 一 时 刻 每 个 临界 表 (critical table) 也 只 被 一 个 CPU 访问 。 

大 多 数 的 现代 多 处 理 机 都 采用 上 述 方式 实现 并 行 操作 ,但 是 为 这 类 计算 机 编写 操作 系 
统 的 困难 在 于 临界 区 的 划分 , 即 把 临界 区 划分 成 由 不 同 CPU 并 行 执行 而 互 不 干扰 。 另 外 ， 
对 于 被 两 个 或 多 个 临界 区 使 用 的 表 必须 通过 互 斥 信 号 量 加 以 保护 ,而 且 使 用 这 些 表 的 代码 
必须 正确 地 使 用 互 斥 信 号 量 。 

同时 ,要 避免 死 锁 的 发 生 。 如 果 两 个 临界 区 都 需要 表 A 和 表 B, 其 中 一 个 首先 申请 A， 
另 一 个 首先 申请 B, 那 么 很 有 可 能 会 发 生死 锁 。 理 论 上 ,可 以 把 所 有 的 表 都 赋 一 个 整数 值 ， 
并 且 所 有 的 临界 区 都 以 升序 的 方式 获得 表 , 这 样 可 以 避免 死 锁 ,但 这 需要 程序 员 清楚 地 知道 
每 个 临界 区 需要 哪些 表 ,然后 按照 正确 的 次 序 安排 请 求 。 随 着 时 间 的 变化 ,临界 区 需要 的 表 
也 会 动态 地 变化 。 如 果 有 新 程序 员 接 手 该 工作 ,上 且 不 了 解 系统 的 整个 多 辑 ,该 程序 员 若 采用 
“临界 区 需要 的 时 候 获得 表 , 不 需要 的 时 候 释 放 表 ”的 思想 ,很 可 能 会 产生 死 锁 。 


8.1.3 多 处 理 机 同步 


在 多 处 理 机 中 ,CPU 之 间 经 常 需要 同步 ,例如 ,访问 内 核 临 界 区 和 表 时 ,需要 互 斥 信号 
量 进 行 保护 。 本 节 主 要 介绍 多 处 理 机 中 CPU 之 间 的 同步 原理 。 

如 果 一 个 进程 在 单 处 理 机 中 需要 访问 一 些 内 核 临 界 表 的 系统 调用 ,那么 内 核 代码 在 接 
触 该 表 之 前 可 以 先 禁 止 中 断 , 然 后 继续 工作 ,在 相关 工作 完成 之 前 ,不 会 有 任何 其 他 的 进程 
来 访问 该 表 。 在 多 处 理 机 中 ,禁止 中 断 的 操作 只 影响 到 完成 禁止 中 断 操作 的 这 个 CPU ,其 
他 的 CPU 仍然 继续 运行 并 且 可 以 访问 临界 表 。 因 此 ,必须 采用 一 种 合适 的 互 斥 信号 量 协 
议 ,而 且 所 有 的 CPU 都 遵守 该 协议 以 保证 互 斥 工作 的 进行 。 

本 文 以 指令 TSL(Test and Set Lock ) 为 例 解释 临界 区 的 实现 方式 。 该 指令 读 出 一 个 存 
储 器 字 并 把 它 存储 在 一 个 寄存 器 中 。 同 时 , 它 对 该 存储 器 字 写 入 一 个 1( 或 某 些 非 零 值 ) 。 
这 需要 两 个 总 线 周 期 来 完成 存储 器 的 读 写 。 在 单 处 理 机 中 ,只 要 该 指令 不 被 中 途中 断 ,TSL 
指令 始终 照常 工作 。 

在 多 处 理 机 中 ,如 图 8-10 所 示 ,存储 器 字 1000 中 被 初始 化 为 0。 若 两 个 CPU 按照 下 列 
的 顺序 执行 TSL 指令 时 就 会 出 现 互 斥 失 败 : 第 1 步 ,.CPU 1 读 出 该 字 , 得 到 一 个 0; 第 2 
步 ,在 CPU 1 有 机 会 把 该 字 写 为 1 之 前 ,CPU 2 进入 ,并 且 也 读 出 该 字 为 0; 第 3 步 ,CPU 1 
把 1 写 和 该 字 ; 第 4 步 ,CPU 2 也 把 1 写 入 该 字 。 两 个 CPU 都 采用 TSL 指令 得 到 0, 所 以 
两 者 都 对 临界 区 进行 访问 ,并 且 互 斥 失败 。 
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CPU 1 在 信 器 字 1000 存储 器 CPU2 
被 初始 化 为 0 
| 
1. CPU 1 读 一 个 0 2. CPU 2 读 一 个 0 | 
3.CPU 1 写 一 个 1 4.CPU2 写 一 个 1 


图 8-10 TSL 指令 失效 


为 了 阻止 这 种 情况 的 发 生 ,TSL 指令 必须 首先 锁 住 总 线 , 阻 止 其 他 CPU 访问 它 , 然 后 
进行 存储 器 的 读 写 访问 ,再 解锁 总 线 。 对 总 线 加 锁 的 典型 做 法 是 , 先 使 用 通常 的 总 线 协议 请 
求 总 线 , 并 声明 已 拥有 某 些 特定 的 总 线 线路 ,直到 两 个 周期 总 线 全 部 完成 。 只 要 始终 保持 拥 
有 这 一 特定 的 总 线 线路 ,那么 其 他 CPU 就 不 会 得 到 总 线 的 访问 权 。 这 个 指令 只 有 在 拥有 
必要 的 线路 和 使 用 它们 的 (硬件 ) 协 议 基 础 上 才能 实现 。 

如 果 正 确实 现 和 使 用 TSL, 它 能 够 保证 互 斥 机 制 正常 工作 。 但 是 该 互 斥 方法 使 用 了 自 
旋 锁 (spin lock) ,因为 请 求 的 CPU 只 是 在 原 地 尽 可 能 快 地 对 锁 进 行 循环 测试 。 这 样 不 仅 完 
全 浪费 了 提出 请 求 的 各 个 CPU 的 时 间 ,而 且 还 给 总 线 或 存储 器 增加 了 大 量 的 负载 ,严重 地 
降低 了 所 有 其 他 CPU 从 事 正 常 工作 的 速度 。 

理论 上 ,高 速 缓 存 的 实现 能 够 消除 总 线 竞争 的 问题 ,只 要 提出 请 求 的 CPU 已 经 读 取 了 
锁 字 (lock word) , 它 就 可 在 其 高 速 缓存 中 得 到 一 个 副本 。 只 要 没有 其 他 CPU 试图 使 用 该 
锁 ,提出 请 求 的 CPU 就 能 够 用 完 其 高 速 缓存 。 当 拥有 锁 的 CPU 写 入 一 个 1 到 高 速 缓存 并 
释放 它 时 ,高 速 缓存 协议 会 自动 地 将 它 在 远程 高 速 缓存 中 的 所 有 副本 置 为 失效 ,要 求 再 次 读 
取 正 确 的 值 。 

但 事实 并 非 如 此 。 问 题 是 ,高 速 缓存 操作 是 在 32B 和 64B 的 块 中 进行 的 。 通 常 ,拥有 
锁 的 CPU 也 需要 这 个 锁 周围 的 字 , 由 于 TSL 指令 是 一 个 写 指令 ,所 以 它 需 要 互 斥 地 访问 含 
有 锁 的 高 速 缓存 块 。 这 样 ,每 一 个 TSL 都 使 锁 持 有 者 的 高 速 缓存 中 的 块 失效 ,并 且 为 请 求 
的 CPU 取 一 个 私有 的 、 唯 一 的 副本 。 只 要 锁 拥 有 者 访问 到 该 锁 的 邻接 字 , 该 高 速 缓存 块 就 
被 送 进 其 计算 机 。 这 样 ,整个 包含 锁 的 高 速 缓存 块 就 会 不 断 地 在 锁 的 拥有 者 和 锁 的 请 求 者 
之 间 来 回 穿 梭 , 导 致 总 线 流量 比 单个 读 取 一 个 锁 字 更 大 。 

如 果 能 消除 在 请 求 一 侧 的 所 有 由 TSL 引起 的 写 操作 ,就 可 以 明显 地 减少 这 种 开销 。 使 
提出 请 求 的 CPU 首先 执行 一 个 读 操作 来 确定 锁 是 否 空闲 ,就 可 以 实现 这 个 目标 。 只 有 锁 
是 空闲 时 ,TSL 才 真正 去 获取 它 。 这 种 变化 使 大 多 数 的 行为 变 成 读 而 不 是 写 。 如 果 拥 有 锁 
的 CPU 只 是 在 同一 个 高 速 缓存 块 中 读 取 各 种 变量 ,那么 它们 每 个 都 可 以 共享 只 读 方式 拥 
有 一 个 高 速 缓 存 块 的 副本 ,这 就 消除 了 所 有 的 高 速 缓存 块 传送 。 当 锁 最 终 被 释放 时 , 锁 的 拥 
有 者 进行 写 操作 ,这 需要 互 斥 访 问 ,使 远程 高 速 缓存 中 的 所 有 其 他 副本 失效 。 提 出 请 求 的 
CPU 的 下 一 个 读 请 求 中 ,高 速 缓 存 块 会 被 重新 装载 。 如 果 两 个 或 更 多 的 CPU 竞争 同一 个 
锁 ,那么 有 可 能 出 现 两 者 同时 看 到 锁 是 空闲 的 ,于 是 同时 用 TSL 指令 去 获取 它 。 只 有 其 中 
的 一 个 会 成 功 ,因为 真正 的 获取 是 由 TSL 指令 进行 的 ,而 且 该 指令 是 原子 性 的 。 即 使 看 到 
了 锁 空 闲 ,然后 立即 用 TSL 指令 试图 获得 它 , 也 不 能 保证 真正 得 到 它 。 不 过 对 于 该 算法 的 
正确 性 来 讲 ,并 不 关心 到 底 哪个 CPU 得 到 了 锁 。 纯 读 出 操作 的 成 功 只 是 意味 着 可 能 是 获 


245 


MY 


操作 系统 原理 及 Li nux 内 核 分 析 (第 2 版 ) 


得 了 锁 , 但 并 不 能 确保 成 功 地 得 到 锁 。 

另 一 个 减少 总 线 流量 的 方式 是 使 用 著名 的 以 太 网 二 进 制 指数 补偿 算法 (binary 
exponential backoff algorithm) 。 不 采用 连续 轮 询 ,而 是 把 延迟 循环 插入 轮 询 之 间 。 初 始 的 
延迟 是 一 条 指令 。 如 果 锁 仍然 忙 ,加 倍 延迟 成 两 条 指令 ; 如 果 锁 还 忙 ,再 加 倍 延 迟 成 4 条 指 
令 ; 以 此 类 推 ,直到 某 个 最 大 值 。 当 锁 释 放 时 , 较 低 的 最 大 值 会 产生 快速 的 响应 ,但 是 会 浪 
费 较 多 的 总 线 周 期 在 高 速 缓存 的 颠 艇 上 。 而 较 高 的 最 大 值 可 减少 高 速 缓存 的 颠 艇 ,但 是 其 
代价 是 不 会 注意 到 锁 如 此 迅速 地 成 为 空闲 。 二 进 制 指数 补偿 算法 无 论 在 有 无 TSL 指令 的 
纯 读 的 情况 下 都 适用 。 

还 有 一 个 更 好 的 思想 是 ,让 每 个 打算 获得 互 斥 信号 量 的 CPU 都 拥有 各 自用 于 测试 的 
私有 锁 变量 ,如 图 8-11 所 示 。 有 关 的 变量 应 该 存放 在 未 使 用 的 高 速 缓存 块 中 以 避免 冲突 。 
给 一 个 未 能 获得 锁 的 CPU 分 配 一 个 锁 变 量 并 且 把 它 附 在 等 待 该 锁 的 CPU 链表 的 末端 。 
在 当前 锁 的 持 有 者 退出 临界 区 时 ,其 释放 链表 中 的 首 个 正在 测试 和 色 有 锁 的 CPU, 然 后 该 
CPU 进入 临界 区 ,操作 完成 之 后 ,该 CPU 释放 锁 ,其 后 继 者 接着 使 用 ,以 此 类 推 。 该 算法 能 
够 有 效 工作 ,而 且 消 除了 饥饿 问题 。 

加 CPU 3 在 这 个 


(私有 ) 锁 上 轮转 












































CPU 2 在 这 个 
CPU 2 在 这 个 _ CPU 4 在 这 个 
(私有 ) 锁 上 轮转 | (私有 ) 馈 上 加 转 
2 4 图 业 
失事 存 神器 一 一 | 当 CPU 1 在 实际 锁 上 完成 
Es 时 ， 它 释放 该 锁 ， 同 时 
CPU 1 持 有 实际 锁 也 释放 CPU 2 正在 其 上 轮 














1 转 的 私有 锁 





图 8-11 使 用 多 个 锁 可 防止 高 速 缓 存 颠 签 


不 论 是 连续 轮 询 方式 .间歇 轮 询 方式 还 是 把 自己 附 在 等 候 CPU 链表 中 的 方式 ,都 假定 
需要 加 锁 的 互 斥 信 号 量 的 CPU 只 是 保持 等 待 。 有 时 对 于 提出 请 求 的 CPU 而 言 , 只 有 等 
待 。 例 如 ,假设 一 些 CPU 是 空闲 的 ,需要 访问 共享 的 就 绪 链 表 (ready list) ,以 便 选择 一 个 进 
程 运行 。 如 果 就 绪 链表 被 锁 住 了 ,CPU 必须 保持 等 待 直到 能 够 访问 该 就 绪 链 表 。 这 种 现象 
称 为 CPU 的 自 旋 。 

然而 ,在 其 他 情况 中 却 存在 着 别 的 选择 。 例 如 ,如 果 某 个 CPU 中 的 某 些 线程 需要 访问 
文件 系统 缓冲 区 高 速 缓存 ,而 该 文件 系统 缓冲 区 高 速 缓存 正好 被 锁 住 了 ,那么 该 CPU 可 以 
决定 切换 至 另 一 个 线程 而 不 是 等 待 。 这 种 现象 称 为 CPU 的 线程 切换 。 

车 自 旋 和 线程 切换 都 是 可 行 的 选择 ,由 上 述 可 知 , 自 旋 直 接 浪 费 了 CPU 周期 ,重复 地 
测试 锁 并 不 是 高 效 的 方式 。 不 过 ,线程 切换 也 浪费 了 CPU 周期 ,因为 必须 保存 当前 线程 的 
状态 ,必须 获得 保护 就 绪 链 表 的 锁 ,还 必须 选择 一 个 线程 ,必须 装 入 其 状态 ,并 且 使 其 开始 运 
行 。 更 进一步 ,该 CPU 高 速 缓存 还 包含 所 有 不 合适 的 高 速 缓存 块 ,因此 在 线程 开始 运行 的 
时 候 会 发 生 很 多 代价 高 昂 的 高 速 缓存 未 命中 。TLB 也 可 能 失效 。 最 后 ,会 发 生 返 回 至 原来 
线程 的 切换 ,会 有 更 多 的 高 速 缓存 未 命中 。 花 费 在 这 两 个 线程 间 来 回 切 换 和 所 有 高 速 缓 存 
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未 命中 的 CPU 周期 都 浪费 了 。 

如 果 预 先知 道 互 斥 信号 量 通常 被 持 有 的 时 间 , 如 50ps, 而 从 当前 线程 切换 需要 lms, 稍 
后 切换 返回 还 需 lms, 那 么 在 互 斥 信号 量 上 自 旋 更 为 有 效 。 而 如 果 互 斥 信号 量 的 平均 保持 
时 间 是 10ms, 那 么 线程 切换 就 更 为 有 效 。 问 题 在 于 临界 区 在 这 个 期 间 会 发 生 相 当 大 的 变 
化 。 关 键 是 采用 何 种 设计 方案 。 

第 一 种 设计 方案 是 总 是 进行 自 旋 。 第 二 种 设计 方案 是 总 是 进行 切换 。 而 第 三 种 设计 方 
案 是 每 当 遇 到 一 个 锁 住 的 互 斥 信号 量 时 就 单独 做 出 决定 。 在 必须 做 出 决定 的 时 刻 , 并 不 知 
道 自 旋 和 切换 哪 一 种 方案 更 好 ,但 是 对 于 任何 给 定 的 系统 ,有 可 能 对 其 所 有 的 有 关 活 动 进行 
跟踪 ,并 且 随 后 进行 离线 分 析 , 然 后 就 可 以 确定 哪个 决定 最 好 及 在 最 好 情形 下 所 花费 的 时 
间 。 这 种 事后 算法 (hindsight algorithm) 成 为 对 可 行 算法 进行 测量 的 基准 评测 标准 。 
多 数 的 研究 采用 这 样 的 模型 : 一 个 未 能 获得 互 斥 信号 量 的 线程 自 旋 一 段 时 间 , 如 果 时 
间 超 过 某 个 阔 值 , 则 进行 切换 ,在 某 些 情况 下 ,该 闵 值 只 是 一 个 定 值 , 典 型 值 只 是 切换 至 另 一 
个 线程 再 切换 回来 的 开销 。 在 另 一 些 情况 下 ,该 阔 值 是 动态 变化 的 , 它 取 决 于 所 观察 到 的 等 
待 互 斥 信号 量 的 历史 信息 。 

在 系统 跟踪 若干 最 新 的 自 旋 时 间 并 且 假 定 当前 的 情形 可 能 会 同 先前 的 情形 类 似 时 ,就 
可 以 得 到 最 好 的 结果 。 例 如 ,假定 还 是 1ms 切换 时 间 ,线程 自 旋 时 间 最 长 为 2ms, 但 是 要 观 
察 实 际 上 自 旋 了 多 长 时 间 。 如 果 线 程 未 能 获取 锁 ,并 且 发 现在 之 前 的 3 轮 中 平均 等 待 时 间 
为 200ps ,那么 ,在 切换 之 前 就 应 该 先 自 旋 2ms。 但 是 ,如 果 发 现在 先前 的 每 次 尝试 中 线程 
都 自 旋 了 整整 2ms, 则 应 该 立即 切换 而 不 再 自 旋 。 


8.1.4 处理 机 调度 


在 探讨 多 处 理 机 调度 之 前 ,需要 确定 调度 的 对 象 是 什么 。 过 去 , 当 所 有 进程 都 是 单个 线 
程 的 时 候 , 调 度 的 单位 是 进程 ,因为 没有 其 他 可 以 调度 的 。 所 有 的 现代 操作 系统 都 支持 多 线 
程 进程 ,这 让 调度 变 得 更 加 复杂 。 

线程 是 内 核 线程 还 是 用 户 线程 至 关 重要 。 如 果 线 程 是 由 用 户 空 间 库 维护 的 ,而 对 内 核 
不 可 见 , 那 么 调度 一 如 既往 地 基于 单个 进程 。 如 果 内 核 并 不 知道 线程 的 存在 , 它 就 不 能 调度 
线程 。 

对 内 核 线程 来 说 ,情况 有 所 不 同 。 在 这 种 情况 下 所 有 线程 均 是 内 核 可 见 的 ,内 核 可 以 选 
择 一 个 进程 的 任 一 线程 。 在 这 样 的 系统 中 ,发 展 趋势 是 内 核 选择 线程 作为 调度 单位 ,线程 从 
属 的 那个 进程 对 于 调度 算法 只 有 很 小 的 影响 。 下 面 探 讨 线程 调度 ,当然 ,对 于 单线 程 进程 
(single-threaded process) 系 统 或 者 用 户 空 间 线程 ,调度 单位 依然 是 进程 。 

进程 和 线程 的 选择 并 不 是 调度 中 的 唯一 问题 。 在 单 处理 机 中 ,调度 是 一 维 的 , 即 接 下 来 
应 该 运行 哪个 新 线程 。 在 多 处 理 机 中 ,调度 是 二 维 的 ,调度 程序 必须 决定 哪 一 个 进程 运行 以 
及 在 哪 一 个 CPU 上 运行。 在 多 处 理 机 中 增加 的 维 数 大 大 增加 了 调度 的 复杂 性 。 

另 一 个 造成 复杂 性 的 因素 是 ,在 有 些 系统 中 所 有 的 线程 是 不 相关 的 ,而 在 另外 一 些 系统 
中 它们 是 成 组 的 ,属于 同一 个 应 用 并 且 协 同 工 作 。 前 一 种 情况 的 例子 是 分 时 系统 ,其 中 独立 
的 用 户 运行 相互 独立 的 进程 ,这 些 不 同 进程 的 线程 之 间 没 有 关系 ,因此 其 中 的 每 一 个 都 可 以 
独立 调度 而 不 用 考虑 其 他 的 线程 。 

后 一 种 情况 的 例子 通常 发 生 在 程序 开发 环境 中 。 大 型 系统 中 通常 有 一 些 供 实 际 代码 使 
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用 的 包含 宏 、 类 型 定义 以 及 变量 声明 等 内 容 的 头 文件 。 当 一 个 头 文件 改变 时 ,所 有 包含 它 的 
代码 文件 必须 被 重新 编译 。 通 常 make 程序 用 于 管理 开发 工作 。 调 用 make 程序 时 , 若 头 文 
件 或 代码 文件 被 修改 了 , 仅 编 译 那些 必须 重新 编译 的 代码 文件 ,仍然 有 效 的 目标 文件 不 再 重 
复生 成 。 





1. 分 时 


本 节 首 先 介 绍 独立 线程 的 调度 ,然后 再 介绍 相关 线程 的 调度 。 处 理 独立 线程 的 最 简单 
的 算法 是 为 就 绪 线 程 维 护 一 个 系统 级 的 数据 结构 ,可 能 是 一 个 链表 ,也 可 能 是 对 应 不 同 优先 
级 的 一 个 链表 集合 。 如 图 8-12(a) 所 示 , 有 16 个 CPU 正在 忙碌 ,有 不 同 优先 级 的 14 个 线程 
在 等 待 运行 。 第 一 个 将 要 完成 其 当前 工作 (或 其 线程 将 被 阻塞 ) 的 CPU 是 CPU 4, 然 后 
CPU 4 锁 住 调度 队列 (Cscheduling queue) ,并 选择 优先 级 最 高 的 线程 A, 如 图 8-12(b) 所 示 。 
接着 ,CPU 12 空闲 并 选择 线程 B, 如 图 8-12(c) 所 示 。 只 要 线程 完全 无 关 , 采 用 这 种 调度 方 
式 很 容易 高 效 地 实现 。 
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图 8-12 使 用 单一 数据 结构 调度 一 个 多 处 理 机 


与 单 处 理 机 系统 类 似 ,所 有 单个 调度 数据 结构 分 时 共享 这 些 CPU, 同 时 还 支持 自动 负 
载 平衡 , 绝 不 会 出 现 一 个 CPU 空闲 而 其 他 CPU 过 载 的 情况 。 不 过 该 方法 有 两 个 缺点 : 一 
个 是 随 着 CPU 数量 增加 ,会 引起 对 调度 数据 结构 的 潜在 竞争 ; 二 是 当 线程 发 生 IO 阻塞 时 
会 引起 上 下 文 切换 的 开销 (overhead)。 
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在 线程 的 时 间 片 用 完 时 ,也 可 能 发 生 上 下 文 切换 。 此 时 ,多 处 理 机 与 单 处 理 机 的 属性 不 
同 。 假 设 某 个 线程 在 其 时 间 片 用 完 时 持 有 一 把 自 旋 锁 。 在 该 线程 被 再 次 调度 并 且 释 放 该 锁 
之 前 ,其 他 等 待 该 自 旋 锁 的 CPU 只 是 把 时 间 浪 费 在 自 旋 上 。 而 在 单 处 理 机 中 极 少 采用 自 
旋 锁 ,因此 ,如果 互 斥 信号 量 的 一 个 线程 被 挂 起 ,而 另 一 个 线程 启动 并 试图 获取 该 互 斥 信号 
量 , 则 该 线程 会 立即 被 阻塞 ,这 样 只 浪费 了 少量 时 间 。 

为 了 避免 这 种 异常 情况 ,一 些 系 统 采用 智能 调度 (smart scheduling) 的 方法 ,其 中 ,获得 
了 自 旋 锁 的 线程 设置 一 个 进程 范围 内 的 标志 ,以 表示 它 目 前 拥有 了 一 个 自 旋 锁 。 当 它 释放 
该 自 旋 锁 时 ,就 清除 这 个 标志 。 这 样 调 度 程序 就 不 会 停止 持 有 自 旋 锁 的 线程 ,相反 ,调度 程 
序 会 给 予 该 线程 稍微 多 一 些 的 时 间 让 它 完 成 临界 区 内 的 工作 并 释放 自 旋 锁 。 

调度 中 的 另 一 个 主要 问题 是 , 当 所 有 CPU 分 时 轮转 平等 调度 时 , 某 些 进程 就 会 不 平 
等 。 特 别 是 , 当 线程 A 已 经 在 CPU A 上 运行 了 很 长 一 段 时 间 时 ,CPU A 的 高 速 缓存 装 满 了 
A 的 块 。 若 A 很 快 重新 开始 运行 ,那么 如 果 它 在 CPU k 上 运行 ,性 能 可 能 会 更 好 一 些 , 因 
为 CPUA 的 高 速 缓存 也 许 还 存 有 A 的 一 些 块 。 预 装 高 速 缓存 块 将 提高 高 速 缓存 的 命中 率 
从 而 提高 线程 的 速度 。 另 外 ,TLB 也 可 能 含有 正确 的 页 面 , 从 而 减少 了 TLB 失效 率 。 

有 些 多 处 理 机 考虑 了 上 述 因素 ,并 使 用 了 亲和力 调度 (affinity scheduling) 的 方法 。 其 
基本 思想 是 尽量 使 一 个 线程 在 它 前 一 次 运行 过 的 同一 个 CPU 上 运行。 实现 该 方法 的 途径 
是 采用 两 级 调度 算法 (two-level scheduling algorithm) 。 当 一 个 线程 被 创建 时 , 它 被 分 配 一 
个 在 此 刻 有 最 小 负载 的 CPU。 把 线程 分 给 CPU 的 工作 在 算法 的 顶层 进行 ,其 结果 是 每 个 
CPU 获得 了 自己 的 线程 集 。 线 程 的 实际 调度 在 算法 的 底层 进行 。 它 由 每 个 CPU 使 用 优先 
级 或 其 他 的 方式 分 别 进行 。 通 过 试图 让 一 个 线程 在 其 生命 周期 内 在 同一 个 CPU 上 运行 的 
方法 ,使 得 高 速 缓存 的 亲和力 得 到 了 最 大 化 。 不 过 ,如 果 某 一 个 CPU 没有 线程 运行 , 它 便 
选取 另 一 个 CPU 的 线程 来 运行 而 不 是 空转 。 

两 级 调度 算法 的 优点 为 : 第 一 , 它 把 负载 大 致 平均 地 分 配 在 可 用 的 CPU 上 ; 第 二 , 它 
尽 可 能 发 挥 了 高 速 缓存 亲和力 的 优势 ; 第 三 ,通过 为 每 个 CPU 提供 一 个 私有 的 就 绪 线程 链 
表 , 由 于 试图 使 用 另 一 个 CPU 的 就 绪 线程 链表 的 机 会 较 小 ,使 得 对 就 绪 线程 链表 的 竞争 降 
到 了 最 低 。 


2. 空间 共享 


当 线程 之 间 以 某 种 方式 彼此 相关 时 ,可 以 使 用 其 他 多 处 理 机 调度 方法 。 经 常 还 有 一 个 
进程 创建 多 个 共同 工作 的 线程 的 情况 发 生 。 例 如 , 当 一 个 进程 的 多 个 线程 间 频 繁 地 进行 通 
信 时 ,让 其 在 同一 时 间 执 行 就 显得 尤为 重要 ,这 需要 在 多 个 CPU 上 同时 调度 这 些 线程 。 在 
多 个 CPU 上 同时 调度 多 个 线程 称 为 空间 共享 (space sharing) 。 

若 一 组 相关 的 线程 是 一 次 性 创建 的 ,在 其 创建 的 时 刻 , 调 度 程 序 检 查 是 否 有 和 线程 数量 
一 样 多 的 空闲 CPU 存在 ,如 果 有 ,每 个 线程 获得 各 自 专 用 的 CPU 并 且 都 开始 运行 ,并 且 该 
CPU 被 送 回 可 用 CPU 池 中 ,如 果 一 个 线程 在 IO 上 阻塞 , 它 继续 保持 其 CPU ,而 该 CPU 
空闲 直到 该 线程 被 唤醒 。 在 下 一 批 线程 出 现时 ,应 用 同样 的 算法 。 这 是 最 简单 的 空间 共享 
算法 。 

在 任何 一 个 时 刻 ,全 部 CPU 被 静态 地 划分 成 若干 个 分 区 ,每 个 分 区 都 运行 一 个 进程 中 
的 线程 。 例 如 ,如 图 8-13 所 示 ,分 区 的 大 小 是 4.6、8 和 12 个 CPU, 有 两 个 CPU 没有 分 配 。 
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随 着 时 间 的 推移 ,新 的 线程 创建 , 旧 的 线程 终止 ,CPU 分 区 大 小 和 数量 都 会 发 生变 化 。 
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图 8-13 32 个 CPU 被 分 成 4 个 分 区 ,其 中 两 个 CPU 未 分 配 


必须 采用 周期 性 的 调度 策略 。 在 单 处 理 机 系统 中 , 短 作业 优先 是 批 处 理 调度 中 知名 的 
算法 。 在 多 处 理 机 系统 中 类 似 的 算法 是 ,选择 需要 最 少 的 CPU 周期 数 的 线程 , 即 其 CPU 
周期 数 乘 以 运行 时 间 最 小 的 线程 为 候选 线程 。 然 而 ,在 实际 中 ,该 信息 很 难得 到 ,因此 该 算 
法 难以 实现 。 

在 这 个 简单 的 分 区 模型 中 ,一 个 线程 请 求 一 定数 量 的 CPU ,或 者 全 部 得 到 或 者 一 直 等 
到 有 足够 数量 的 CPU 可 用 为 止 。 另 一 种 处 理 方式 是 主动 地 管理 线程 的 并 行 度 。 这 需要 使 
用 一 个 中 心服 务 器 ,用 它 跟 踪 哪 些 线程 正在 运行 ,哪些 线程 希望 运行 以 及 所 需 CPU 的 最 小 
和 最 大 数量 。 每 个 应 用 程序 周期 性 地 询问 中 心服 务 器 有 多 少 CPU 可 用 ,然后 它 调整 线程 
的 数量 以 符合 可 用 的 数量 。 例 如 ,一 台 Web 服务 器 可 以 并 行 运行 5、10、20 个 或 者 任何 其 他 
数量 的 线程 。 如 果 它 当前 有 10 个 线程 ,突然 系统 对 CPU 的 需求 增加 了 ,于 是 它 被 通知 可 用 
的 CPU 数量 减 到 了 5 个 ,那么 在 接 下 来 的 5 个 线程 完成 其 当前 工作 之 后 ,它们 就 被 通知 退 
出 而 不 是 给 予 新 的 工作 。 这 种 机 制 允许 分 区 大 小 动态 变化 ,以 便 与 当前 负载 相 匹 配 ,该 方法 
优 于 图 8-13 中 的 固定 系统 。 


3. 群 调度 


空间 共享 的 一 个 明显 优点 是 消除 了 多 道 程序 设计 ,从 而 消除 了 上 下 文 切换 的 开销 。 但 
是 ,明显 的 缺点 是 当 线 程 被 阻塞 或 CPU 根本 无 事 可 做 时 时 间 被 浪费 了 ,只 有 等 到 该 线程 再 
次 就 绪 。 于 是 , 既 可 以 调度 时 间 又 可 以 调度 空间 的 算法 就 显得 比较 重要 了 ,特别 是 对 于 要 创 
建 多 个 彼此 之 间 相互 通信 的 线程 。 

假设 一 个 系统 中 有 线程 A0 和 Al 属于 进程 A, 而 线程 B0 和 Bl 属于 进程 B。 线 程 A0 
和 BO0 在 CPU 0 上 分 时 ,而 线程 Al 和 Bl 在 CPU1 上 分 时 ,如 图 8-14 所 示 。 线 程 Ao 和 Al 
需要 经 常 通信 。 其 通信 模式 是 ,A0 送 给 Al 一 个 消息 ,然后 Al 回 送 给 A0 一 个 应 答 。 假 设 
正好 是 Ao 和 Bl 首先 开始 执行 。 

在 时 间 片 0,A0 给 Al 发 送 一 个 请 求 ,但 是 直到 Al 在 100ms 的 时 间 片 1 中 开始 运行 时 
才 得 到 该 请 求 。Al 立即 给 A0 发 送 一 个 应 答 ,但 是 直到 A0 在 200ms 再 次 运行 时 才 得 到 该 
应 答 。 结 果 是 每 200ms 一 个 请 求 -应 答 序列 ,这 个 结果 并 不 理想 。 

解决 该 问题 的 方案 是 群 调度 (gang scheduling)。 群 调度 由 3 个 部 分 组 成 : 
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线程 A0 运 行 
CPU0| AO BO A0 B0 A0 B0 
1 请求 1 请 求 2 1 1 
| 应 答 1 应 答 2 | | 
CPU1 Bl1 Al Bl Al Bl Al 
1 1 1 % 1 1 
1 1 1 1 1 1 1 
时 间 0 100 200 300 400 500 600 


8-14 进程 A 的 两 个 异步 运行 的 线程 间 的 通信 


(1) 把 一 组 相关 线程 作为 一 个 单位 ,组 成 一 个 群 (gang) ,一 起 调度 。 

(2) 一 个 群 中 的 所 有 成 员 在 不 同 的 分 时 CPU 上 同时 运行 。 

(3) 群 中 的 所 有 成 员 共 同 开始 和 结束 其 时 间 片 。 

使 群 调度 正确 工作 的 关键 是 同步 调度 所 有 的 CPU , 即 把 时 间 划 分 为 离散 的 时 间 片 。 在 
每 一 个 新 的 时 间 片 开始 时 ,所 有 的 CPU 都 重新 调度 ,在 每 个 CPU 上 都 开始 一 个 新 的 线程 。 
在 后 续 的 时 间 片 开始 时 , 另 一 个 调度 事件 发 生 。 在 此 之 间 没 有 调度 行为 。 如 果 某 个 线程 被 
阻塞 , 它 的 CPU 保持 空闲 ,直到 对 应 的 时 间 片 结束 为 止 。 

群 调度 的 工作 原理 如 图 8-15 所 示 , 一 台 带 6 个 CPU 的 多 处 理 机 由 5 个 进程 A 一 下 使 
用 ,总 共有 24 个 就 绪 线程 。 在 时 间 覃 (time slot)0, 线 程 A0 至 A5 被 调度 运行 ; 在 时 间 覃 
1 ,调度 线程 B0、.B1、B2、C0、Cl 和 C2; 在 时 间 槽 2, 进 程 D 的 5 个 线程 DO 一 D4 以 及 E0 运 
行 ; 剩 下 的 6 个 线程 属于 下 ,在 时 间 槽 3 中 运行 。 然 后 周期 重复 进行 。 
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图 8-15 群 调度 的 工作 原理 


群 调度 的 思想 是 ,让 进程 的 所 有 线程 一 起 运行 ,这 样 ,如 果 其 中 一 个 线程 向 另 一 个 线程 
发 送 请 求 ,接收 方 几乎 会 立即 得 到 消息 ,并 且 几 乎 能 够 立即 应 答 。 在 图 8-15 中 ,由 于 进程 的 
所 有 线程 在 同一 个 时 间 片 内 一 起 运行 ,它们 可 以 在 一 个 时 间 片 内 发 送 和 接收 大 量 的 消息 ,从 
而 消除 了 图 8-14 中 的 问题 。 


@.2 多 计算 机 


多 处 理 机 提供 了 一 个 简单 的 通信 模型 : 所 有 CPU 共享 一 个 公用 存储 器 ; 进程 可 以 向 
存储 器 写 信息 ,然后 被 其 他 进程 读 取 ; 可 以 使 用 互 斥 信号 量 、 管 程 (monitor) 和 其 他 适合 的 
技术 实现 同步 。 缺 点 是 大 型 多 处 理 机 构造 困难 ,造价 高 昂 。 

为 了 解决 这 个 问题 ,提出 了 多 计算 机 系统 。 多 计算 机 是 紧 耦 合 CPU ,不 共享 存储 器 。 


操作 系统 原理 及 Li nux 内 核 分 析 (第 2 版 ) 


台 计 算 机 有 自己 的 存储 器 。 这 样 的 系统 称 为 计算 机 群 (cluster computers) 或 工作 站 群 
(clusters of workstations) 。 

多 计算 机 系统 容易 构造 ,因为 其 基本 部 件 只 是 一 台 配 有 高 性 能 网 络 接口 卡 的 PC 裸 机 。 
获得 高 性 能 需要 巧妙 地 设计 互连网 络 以 及 接口 卡 ,该 问题 与 在 一 台 多 处 理 机 中 构造 共享 存 
储 器 是 完全 类 似 的 。 但 是 ,由 于 目标 是 在 征 秒 (ws) 数 量 级 上 发 送 消息 ,而 不 是 在 纳 秒 (ns) 数 
量 级 上 访问 存储 器 ,所 以 这 是 一 个 相对 简单 便宜 且 容 易 实 现 的 任务 。 

本 节 首 先 简要 介绍 多 计算 机 硬件 ,特别 是 互 连 硬件 ; 然后 介绍 多 计算 机 软件 ,从 底层 通 
信 软 件 开始 到 高 层 通 信 软 件 ,同时 还 介绍 在 没有 共享 存储 器 的 系统 中 实现 共享 存储 器 的 方 
法 ; 最 后 介绍 调度 和 负载 平衡 的 问题 。 


8.2.1 多 计算 机 硬件 


多 计算 机 的 一 台 基本 节点 包括 一 个 CPU 内存、 一 个 网 络 接口 ,有 时 还 有 一 个 硬盘 。 节 
点 可 以 封装 在 标准 的 PC 机 箱 中 ,不 过 通常 没有 图 像 适 配 卡 、 显 示 器 、 键 盘 和 鼠标 等 。 在 某 
些 情况 下 ,PC 中 有 一 块 2 通道 或 4 通道 的 多 处 理 机 主板 ,可 能 带 有 双核 或 者 四 核 CPU ,不 
过 为 了 简化 问题 ,假设 每 个 节点 有 一 个 CPU。 通常 成 百 个 甚至 上 千 个 节点 连接 在 一 起 组 成 
一 个 多 计算 机 系统 。 下 面 介绍 一 些 关 于 硬件 组 织 的 相关 内 容 。 


1. 互 连 技术 


每 个 节点 上 有 一 块 网 卡 , 通 过 电缆 (或 光纤 ) 连 到 其 他 的 节点 或 者 交换 机 上 。 在 小 型 系 
统 中 ,例如 图 8-16(a) 所 示 的 星 形 拓 扑 结 构 中 ,会 有 一 个 连接 所 有 节点 的 交换 机 。 现 代 交 换 
型 以 太 网 就 采用 了 这 种 拓扑 结构 。 

如 图 8-16(b) 所 示 ,节点 可 以 组 成 一 个 环 ,形成 环形 拓扑 结构 。 每 个 节点 有 两 根 线 从 网 
络 接口 卡 上 出 来 ,一 根 连接 左边 的 节点 , 另 一 根 连 接 右边 的 节点 。 在 这 种 拓扑 结构 中 不 需要 
交换 机 。 

图 8-16(c) 中 的 网 格 (grid 或 mesh) 是 在 许多 商业 系统 中 应 用 的 二 维 设计 。 该 拓扑 结构 
相当 规整 ,而 且 容 易 扩展 为 大 规模 系统 。 该 系统 有 一 个 直径 (diameter), 即 任意 两 个 节点 之 
间 的 最 长 路 径 , 并 且 该 值 与 节点 数目 的 平方 根 成 正比 。 网 格 的 变种 是 双 凸 面 (double 
turus) ,如 图 8-16(d) 所 示 ,是 一 种 边 连通 的 网 格 。 该 拓扑 结构 较 网 格 具 有 更 强 的 容错 能 力 。 
由 于 对 角 之 间 的 通信 只 需要 两 跳 ,该 拓扑 结构 的 直径 也 比较 小 。 

图 8-16(e) 中 的 立方 体 (cube) 是 一 种 规则 的 三 维 拓扑 结构 。 图 8-16(e) 是 2 X 2 X 2 立 
方 体 ,更 一 般 的 情形 则 是 &XkXk 立方 体 。 在 图 8-16(f) 中 ,是 将 两 个 三 维 立 方 体 对 应 节点 
连接 组 成 四 维 立方 体 。 可 以 仿照 图 8-16(f) 的 结构 ,将 四 维 立 方 体 对 应 的 节点 连接 组 成 五 维 
立方 体 。 为 了 实现 六 维 , 可 以 复制 4 个 立方 体 的 块 并 把 对 应 节点 互 连 起 来 。 以 此 类 推 。 以 
这 种 形式 组 成 的 维 立 方 体 称 为 超 立 方 体 (hypercube)。 因 为 该 拓扑 结构 直径 随 着 维 数 的 
增加 而 线性 增长 ,许多 并 行 计算 机 采用 这 种 拓扑 结构 。 换 言 之 ,直径 是 节点 数 的 自然 对 数 ， 
例如 ,10 维 的 超 立 方 体 有 1024 个 节点 ,但 是 其 直径 仅 为 10, 在 延迟 方面 具有 一 定 的 优势 。 
与 之 相反 的 是 ,对 于 1024 个 节点 ,如 果 按 照 32X32 网 格 布局 , 则 其 直径 为 62, 是 超 立 方 体 
的 6 倍 多 。 对 于 超 立 方 体 而 言 , 获 得 较 小 直径 的 代价 是 扇 出 数量 (fanout) 以 及 由 此 而 来 的 
连接 数量 (及 成 本 ) 的 大 量 增加 。 
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(a) 单 交 换 机 (b) 环 (9) 网 格 



























































































































































(b) 双 凸 面 (e) 立方 体 (0 四维 超 立 方 体 
图 8-16 各 种 互 连 拓扑 结构 


在 多 计算 机 中 可 采用 两 种 交换 机 制 。 一 种 交换 机 制 是 ,每 个 消息 首先 被 分 解 成 为 有 最 
大 长 度 限 制 的 块 , 称 为 包 (packet)。 该 交换 机 制 称 为 存储 转发 包 交 换 (store-and-forward 
packet switching) , 源 节点 的 网 络 接口 卡 将 包 注 入 到 第 一 个 交换 机 ,如 图 8-17(a) 所 示 。 比 
特 串 每 次 进来 一 位 , 当 整 个 包 到 达 输 入 缓冲 区 时 , 它 被 复制 到 沿 着 其 路 径 通 向 的 下 一 个 交换 
机 的 队列 中 ,如 图 8-17(b) 所 示 。 当 包 到 达 目 标 节点 所 连接 的 交换 机 时 ,如 图 8-17(c) 所 示 ， 
该 包 被 复制 进入 目标 节点 的 网 络 接口 卡 , 并 最 终 到 达 其 RAM。 
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i A B + A 1B 端 Q 名 jl B 
ri [ 开 EF Ir 中 Ic Her [9 中 Ic H 
卫 部 加 了 区 
] 
sf 站 三 加 
人 C D 上 C D C D 
(I Har EC Hor rr “中 [ Ee He I Ho 
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(a) 包 到 达 交 换 机 A 中 (b) 包 到 达 交 换 机 C 中 (c) 包 到 达 交 换 机 D 中 























8-17 存储 转发 包 交 换 


存储 转发 包 交 换 的 优点 是 灵活 且 有 效 ,其 缺点 是 包 通 过 互连网 络 时 增加 了 时 延 。 假 设 
在 图 8-17 中 把 一 个 包 传送 一 跳 所 花费 的 时 间 为 了 。 为 了 从 CPU 1 到 CPU 2, 该 包 必 须 被 复 
制 4 次 , 即 至 A、 至 C.、 至 DD 以 及 到 目标 CPU, 而 且 在 前 一 个 包 完成 之 前 ,不 能 开始 有 关 的 复 
制 ,所 以 通过 该 互连网 络 的 时 延 是 4T。 改 进 的 方法 是 ,可 以 把 包 在 逻辑 上 划分 为 更 小 的 单 
元 ,只 要 第 一 单元 到 达 一 个 交换 机 , 它 就 被 转发 到 下 一 个 交换 机 ,甚至 可 以 在 包 的 结尾 到 达 
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之 前 进行 。 该 传送 单元 最 小 可 以 是 1b。 

另 一 种 交换 机 制 是 电路 交换 (circuit switching) , 它 是 由 第 一 个 交换 机 建立 通过 所 有 交 
换 机 到 达 目 标 交换 机 的 一 条 路 径 。 一 旦 该 路 径 建立 起 来 ,比特 流 就 从 源 到 目的 地 通过 整个 
路 径 不 断 地 尽快 输送 。 在 所 涉及 的 交换 机 中 ,没有 中 间 缓 冲 。 电 路 交换 需要 有 一 个 建立 阶 
段 , 它 需 要 花费 时 间 ,但 是 一 旦 建立 完成 ,速度 就 很 快 。 在 此 特 流 发 送 完毕 之 后 ,该 路 径 必 须 
被 拆除 。 电 路 交换 的 一 种 变种 称 为 虫 洞 路 由 (wormhole routing) , 它 把 每 个 包 拆 成 子 包 ,并 
允许 第 一 个 子 包 在 整个 路 径 还 没有 完全 建立 之 前 就 开始 流动 。 


2. 网 络 接口 


在 多 计算 机 中 ,所 有 节点 里 都 有 一 块 接口 板 , 它 实现 节点 与 互连网 络 的 连接 ,这 使 得 多 
计算 机 连 成 一 体 。 这 些 板 的 构造 方式 以 及 它们 同 主 CPU 和 RAM 的 连接 方式 对 操作 系统 
有 重要 影响 。 

在 所 有 的 多 计算 机 中 ,接口 板 上 都 有 RAM 用 来 存储 进出 包 。 在 包 被 传送 到 第 一 个 交 
换 机 之 前 必须 被 复制 到 接口 板 的 RAM 中 。 由 于 许多 互连网 络 是 同步 的 ,一 旦 包 开 始 传送 ， 
比特 流 必 须 以 恒定 的 速率 连续 进行 。 如 果 包 在 主 RAM 中 ,由 于 还 有 其 他 的 信息 流 在 内 存 
总 线 上 ,所 以 不 能 保证 连续 地 将 流 送 到 网 络 上 。 为 了 消除 该 问题 ,需要 在 接口 板 上 使 用 专门 
的 RAM, 如 图 8-18 所 示 。 
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图 8-18 ”网络 接口 板 RAM 在 多 计算 机 中 的 位 置 


接收 方 也 存在 同样 的 问题 。 从 网 络 上 到 达 接 收 方 的 比特 流速 率 是 恒定 的 并 且 较 高 。 若 
网 络 接口 卡 不 能 够 实时 地 对 比特 流 进行 存储 ,部 分 数据 将 会 丢失 。 如 果 试 图 通过 系统 总 线 
将 比特 流 直接 存储 到 主 RAM 中 是 非常 危险 的 。 由 于 网 卡 一 般 插 在 PCI 总 线 上 ,是 唯一 的 
通 向 主 RAM 的 连接 ,因此 不 可 避免 地 要 同 其 他 IO 设备 竞争 总 线 。 因 此 ,需要 把 接收 的 包 
首先 存储 在 接口 板 的 私有 RAM 中 ,然后 等 到 总 线 空 闲 时 ,再 把 它们 复制 到 主 RAM 中 ,这 
样 会 更 安全 。 
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在 接口 板 上 可 以 集成 一 个 或 多 个 DMA 通道 甚至 一 个 完整 的 CPU (乃至 多 个 CPU ) 。 
通过 在 系统 总 线 上 请 求 块 传送 (block transfer) ,DMA 通道 可 以 在 接口 板 和 主 RAM 之 间 以 
非常 高 的 速率 传递 包 , 并 且 每 次 传送 若干 字 , 不 需要 为 单个 字 请 求 总 线 。 正 是 由 于 这 种 块 传 
送 方 式 , 使 得 接口 板 上 必须 有 自己 私有 的 RAM。 

接口 板 上 集成 的 CPU 和 DMA 通道 被 称 为 网 络 处 理 器 (network processor), 且 功能 日 
趋 强大 。CPU 会 将 一 些 工作 分 给 网 卡 ,例如 ,处 理 可 靠 的 传送 (如 果 底 层 的 硬件 会 丢 包 ) ,多 
播 \ 压 缩 /解压 缩 、 加 密 /解密 以 及 在 多 进程 系统 中 处 理 安全 事务 等 。 但 是 ,两 个 CPU 必须 
同步 ,以 避免 增加 额外 开销 的 竞争 发 生 , 并 且 操作 系统 需要 承担 更 多 的 工作 。 


8.2.2 低层 通信 软件 


在 多 计算 机 系统 中 对 包 的 过 度 复制 会 影响 通信 的 性 能 。 最 理想 的 情况 是 一 共有 以 下 
3 次 复制 : 首先 是 源 节点 的 RAM 到 接口 板 的 复制 ,然后 是 从 源 接口 板 到 目的 接口 板 的 复制 
(如 果 在 路 径 上 没有 存储 和 转发 发 生 ) ,最 后 是 从 目的 接口 板 到 目的 RAM 的 复制 。 但 是 ,在 
许多 系统 中 情况 要 复杂 得 多 。 如 果 接 口 板 被 映射 到 内 核 虚拟 地 址 空间 而 不 是 用 户 虚拟 地 址 
空间 时 ,用 户 进程 只 能 通过 内 核 的 系统 调用 的 方式 来 发 送 包 。 内 核 会 同时 在 输入 和 输出 时 
把 包 复制 到 自己 的 存储 空间 ,从 而 避免 在 传送 到 网 络 上 时 出 现 缺 页 异常 (page fault)。 同 
样 ,接收 包 的 内 核 在 有 机 会 检查 包 之 前 ,可 能 也 不 知道 应 该 把 接收 的 包 放 置 到 RAM 的 具体 
位 置 。 上 述 5 个 复制 步骤 如 图 8-18 所 示 。 

如 果 进出 RAM 的 复制 是 性 能 瓶颈 ,那么 进出 内 核 的 额外 复制 会 将 端 到 端的 延迟 加 倍 ， 
并 把 吞吐 量 (throughput) 降 低 一 半 。 为 了 避免 上 述 对 性 能 的 影响 ,一 些 计算 机 把 接口 板 映 
射 到 用 户 空间 ,并 允许 用 户 进程 直接 把 包 传输 到 卡 上 ,并 不 需要 内 核 的 参与 。 该 方法 对 性 能 
有 一 定 的 改善 ,但 是 带 来 了 两 个 问题 。 

首先 ,如 果 在 节点 上 有 多 个 进程 运行 而 且 需 要 访问 网 络 并 发 送 包 ,会 引起 多 个 进程 对 接 
口 板 的 竞争 。 通 过 系统 调用 将 接口 板 映射 到 一 个 用 户 虚 拟 地 址 空间 ,其 代价 是 很 高 的 ,并 
且 , 如 果 只 有 一 个 进程 获得 了 接口 板 ,那么 其 他 进程 将 无 法 发 送 包 。 如 果 接 口 板 被 映射 到 进 
程 A 的 虚拟 地 址 空间 ,而 到 达 的 包 却 是 进程 了 B 的 ,同时 ,如 果 A 和 B 属 于 不 同 的 所 有 者 ,其 
中 任何 一 方 都 不 打算 协助 另 一 方 ,这 时 进程 A 和 B 都 将 无 法 继续 运行 。 解 决 该 问题 的 方案 
是 ,把 接口 板 映射 到 所 有 需要 它 的 进程 中 ,但 是 这 样 做 需要 一 个 避免 竞争 机 制 。 例 如 ,如 果 
进程 A 申请 接口 板 上 的 一 个 缓冲 区 ,而 由 于 时 间 片 到 ,进程 B 开始 运行 并 且 申请 同一 个 组 
冲 区 ,那么 就 会 发 生 冲 突 。 这 需要 有 某 种 同步 机 制 , 但 是 互 斥 信号 量 (mutex) 等 机 制 需要 在 
进程 之 间 彼 此 协作 的 前 提 下 才能 工作 。 在 多 用 户 的 分 时 环境 下 ,所 有 的 用 户 都 希望 其 工作 
尽快 完成 ,因此 某 个 用 户 或 许 会 锁 住 与 接口 板 有 关 的 互 斥 信号 量 而 不 肯 释 放 。 因 此 ,对 于 将 
接口 板 映射 到 用 户 空间 的 方案 ,只 有 在 每 个 节点 上 只 有 一 个 用 户 进 程 运行 时 才能 够 发 挥 作 
用 ,和 否则 必须 设置 专门 的 预防 机 制 (例如 ,对 不 同 的 进程 ,可 以 把 接口 板 上 RAM 的 不 同 部 分 
映射 到 各 自 的 地 址 空间 )。 

其 次 ,内核 本 身 经 常 需要 访问 互联 网 ,例如 ,访问 远程 节点 上 的 文件 系统 。 如 果 让 内 核 
与 任何 用 户 共享 同一 块 接口 板 , 即 便 是 基于 分 时 方式 ,也 会 产生 冲突 。 例 如 , 当 接 口 板 被 映 
射 到 用 户 空间 时 收 到 一 个 内 核 包 。 解 决 该 问题 最 简单 的 方法 是 ,使 用 两 块 网 络 接口 板 , 一 个 
映射 到 用 户 空间 供应 用 程序 使 用 , 另 一 个 映射 到 内 核 空间 供 操作 系统 使 用 。 
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将 包 传送 到 接口 板 上 最 快 的 方法 是 使 用 板 上 的 DMA 芯片 直接 将 它们 从 RAM 复制 到 
接口 板 上 。 但 是 ,DMA 使 用 物理 地 址 而 不 是 虚拟 地 址 ,并 且 独 立 于 CPU 和 运行。 尽管 用 户 
进程 知道 发 送 的 任何 包 的 虚拟 地 址 ,但 它 通常 不 知道 有 关 的 物理 地 址 。 设 计 一 个 系统 调用 
进行 虚拟 地 址 到 物理 地 址 的 映射 是 不 可 取 的 ,因为 把 接口 板 放 到 用 户 空间 的 首要 原因 就 是 
为 了 避免 不 得 不 为 每 个 要 发 送 的 包 进 行 一 次 系统 调用 。 

另外 ,如 果 操 作 系统 决定 替换 一 个 页 面 , 而 DMA 芯片 正在 从 该 页 面 复制 一 个 包 ,就 会 
传送 错误 的 数据 。 然 而 更 严重 的 情况 是 ,如 果 操 作 系统 在 替换 某 个 页 面 的 同时 ,DMA 芯片 
正在 把 一 个 包 复制 进 该 页 面 ,结果 不 仅 进 来 的 包 会 丢失 ,存储 器 页 面 也 会 被 损坏 。 

为 了 解决 上 述 问 题 ,可 采用 将 页 面 钉 住 和 释放 的 系统 ,把 相关 页 面 标 记 成 暂时 不 可 交换 
的 。 但 是 ,这 不 仅 需 要 有 一 个 系统 调用 钉 住 含有 每 个 输出 包 的 页 面 ,还 需要 有 另 一 个 系统 调 
用 进行 释放 工作 ,这 样 的 开销 较 大 。 如 果 包 很 小 ,例如 64B 或 更 小 , 钉 住 和 释放 每 个 缓冲 区 
的 开销 就 不 能 忍受 。 对 于 大 的 包 , 例 如 1KB 或 更 大 ,也 许 能 够 容忍 相关 开销 。 对 于 大 小 在 
这 两 者 之 间 的 包 , 就 要 取决 于 硬件 的 具体 情况 了 。 除 了 对 性 能 的 影响 , 钉 住 和 释放 页 面 还 会 
增加 软件 的 复杂 性 。 


8.2.3 用 户 层 通信 软件 


在 多 计算 机 中 ,不 同 CPU 上 的 进程 通过 互相 发 送 消息 实现 通信 。 操 作 系统 提供 了 一 
种 发 送 和 接收 消息 的 途径 ,使 得 这 些 底层 的 调用 对 用 户 进程 可 用 。 在 较 复 杂 的 情况 下 ,通过 
使 得 远程 通信 看 起 来 像 过 程 调用 的 方法 ,将 实际 的 消息 传递 对 用 户 隐藏 起 来 。 


1. 发 送 和 接收 





在 最 简单 的 情况 下 ,通信 软件 所 提供 的 通信 服务 可 以 减少 到 两 个 调用 ,一 个 用 于 发 送 消 
息 , 男 一 个 用 于 接收 消息 。 发 送 一 条 消息 的 调用 为 

Send (dest, gmptr); 
而 接收 消息 的 调用 为 

Receive (addr, gmptr); 


前 者 把 由 mptr 参数 所 指向 的 消息 发 送 给 由 dest 参数 所 标识 的 进程 ,并 且 引 起 对 调用 
者 的 阻塞 ,直到 该 消息 被 发 出 。 后 者 引起 被 调用 者 的 阻塞 ,直到 信息 到 达 ; 该 信息 到 达 后 ， 
复制 到 由 mptr 参数 所 指向 的 缓冲 区 ,并 且 撤 销 对 调用 者 的 阻塞 。addr 参数 指定 了 接收 者 
要 监听 的 地 址 。 

上 面 是 处 理 编 址 的 方法 。 由 于 多 计算 机 是 静态 的 ,CPU 数目 是 固定 的 ,所 以 处 理 编 址 
问题 最 便利 的 办 法 是 使 addr 由 两 部 分 地 址 组 成 ,其 中 ,一 部 分 是 CPU 编号 , 另 一 部 分 是 在 
该 CPU 上 的 一 个 进程 或 者 端口 的 编号 。 采 用 这 种 方式 ,每 个 CPU 可 以 管理 自己 的 地 址 而 
不 会 有 潜在 的 冲突 。 


2. 阻塞 调用 和 非 阻塞 调用 
上 述 调用 是 阻塞 调用 (有 时 称 为 同步 调用 )。 当 一 个 进程 调用 Send 时 , 它 指 定 一 个 目标 
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和 用 以 发 消息 到 该 目标 的 一 个 缓冲 区 。 当 消息 发 送 时 ,发 送 进程 被 阻塞 ( 挂 起 )。 在 消息 完 
全 发 出 去 之 前 ,不 会 执行 Send 后 面 的 指令 ,如 图 8-19(a) 所 示 。 类 似 地 ,在 消息 真正 接收 并 
且 放 和 由 参数 指定 的 消息 缓冲 区 之 前 ,对 Receive 的 调用 也 不 会 把 控制 返回 。 在 Receive 中 
进程 保持 挂 起 状态 ,直到 消息 到 达 为 止 。 在 有 些 系统 中 ,接收 者 可 以 指定 发 送 者 ,在 这 种 情 
况 下 接收 者 就 保持 阻塞 状态 ,直到 相应 的 发 送 者 消息 到 达 为 止 。 


发 送 者 被 阻塞 
发 送 者 运行 ”| 上 -一 一 一 一 一 一 一 | 发 送 者 运行 
种 入 内 一 
ba 从 内 核 返回 ， 
消息 正在 被 发 送 发 送 者 被 释放 





(a) 一 个 阻塞 的 Send 调 用 


发 送 者 运行 | 共 送 者 灾 昌 守 | 发 送 者 运行 





Wa ten 息 正在 被 发 
消息 正在 被 发 送 
TT 一 
制 到 内 核 
缓冲 区 


(b) 一 个 非 阻塞 的 Send 调 用 
图 8-19 阻塞 的 和 非 阻塞 的 Send 调用 


相对 于 阻塞 调用 的 另 一 种 方式 是 非 阻塞 调用 (有 时 称 为 异步 调用 ) 。 如 果 Send 是 非 阻 
塞 的 ,在 消息 发 出 之 后 , 它 立 即将 控制 返回 给 调用 者 。 该 机 制 的 优点 是 发 送 进程 可 以 继续 运 
行 ,与 消息 传送 并 行 , 而 不 是 让 CPU 空闲 (假设 没有 其 他 可 以 运行 的 进程 )。 通 常 由 系统 设 
计 者 在 阻塞 原 语 和 非 阻塞 原 语 之 间 做 出 选择 ,当然 也 有 少数 系统 中 两 种 原 语 同时 可 用 ,而 让 
用 户 决 定 。 

非 阻塞 调用 的 缺点 是 : 直到 将 发 送 者 消息 送出 ,才能 修改 消息 缓存 区 ; 另外 ,发 送 进程 
不 知道 传输 的 结束 时 间 ,所 以 根本 不 知道 何 时 重用 缓存 区 是 安全 的 。 

解决 上 述 问 题 有 3 种 可 能 的 方案 。 第 一 种 方案 是 ,让 内 核 复制 该 消息 到 内 部 的 内 核 组 
存 区 ,然后 让 进程 继续 ,如 图 8-19(b) 所 示 。 对 于 发 送 者 来 讲 , 该 机 制 与 阻塞 调用 相同 ,只 要 
进程 获得 控制 ,就 可 以 随意 重用 缓存 区 。 当 然 ,消息 还 没有 发 送出 去 ,但 是 发 送 者 是 不 会 被 
这 种 情况 所 妨碍 的 。 该 方案 的 缺点 是 ,对 每 个 送出 的 消息 都 必须 将 其 从 用 户 空间 复制 到 内 
核 空间 。 面 对 大 量 的 网 络 接口 ,消息 最 终 要 复制 进 硬件 的 传输 缓存 区 ,所 以 消息 用 户 空间 复 
制 到 内 核 空间 实质 上 是 时 间 上 的 浪费 ,额外 的 复制 会 明显 地 降低 系统 性 能 。 

第 二 种 方案 是 , 当 消 息 发 送 之 后 中 断 发 送 者 ,告知 缓存 区 又 可 以 使 用 了 。 这 里 不 需要 复 
制 消息 ,从 而 节省 了 时 间 ,但 是 需要 用 户 级 中 断 ,使 编写 程序 变 得 困难 ,并 可 能 要 处 理 竞 争 条 
件 ,使 得 该 方案 难以 设计 和 调试 。 

第 三 种 方案 是 ,让 缓存 区 写 时 复制 (copy on write) , 即 ,在 消息 发 送出 去 之 前 将 其 标记 
为 只 读 。 在 消息 发 送出 去 之 前 ,如 果 缓 存 区 被 重用 , 则 进行 复制 。 该 方案 的 问题 是 ,除非 组 
存 区 被 孤立 在 自己 的 页 面 上 ,负责 对 邻近 变量 的 写 操作 也 会 导致 复制 。 同 时 ,由 于 这 样 的 发 
送 消 息 行为 隐 含 着 对 页 面 读 / 写 状 态 的 影响 ,因此 需要 有 额外 的 管理 。 最 后 ,该 页 面 迟 早 会 





258 


SA 


操作 系统 原理 及 Linux 内 核 分 析 (第 2 版 ) 


再 次 被 写 人 ,这 会 触发 一 次 不 必要 的 复制 。 

这 样 , 在 发 送 端 有 以 下 几 个 选择 : 

(1) 阻塞 发 送 (CPU 在 消息 传输 期 间 空闲 ) 。 

(2) 带 有 复制 操作 的 非 阻塞 发 送 (CPU 时 间 浪 费 在 额外 的 复制 上 ) 。 

(3) 带 有 中 断 操 作 的 非 阻 塞 发 送 (造成 编程 困难 ) 。 

(4) 写 时 复制 (最 终 可 能 也 需要 额外 的 复制 ) 。 

在 正常 条 件 下 ,第 一 种 选择 是 最 好 的 ,特别 是 在 有 多 线程 的 情况 下 , 当 一 个 线程 由 于 试 
图 发 送 而 被 阻塞 后 ,其 他 线程 还 可 以 继续 工作 。 也 不 需要 管理 任何 内 核 缓冲 区 。 而 且 , 如 果 
不 需要 复制 ,消息 会 被 更 快 地 发 出 。 

与 Send 可 以 是 阻塞 和 非 阻塞 的 相同 ,Receive 也 可 以 是 阻塞 和 非 阻 塞 的 。 阻 塞 调用 就 
是 挂 起 调用 者 直到 消息 到 达 为 止 。 如 果 有 多 线程 可 用 ,这 是 一 种 简单 的 方法 。 另 外 , 非 阻塞 
Receive 只 是 通知 内 核 缓冲 区 所 在 的 位 置 , 并 立即 返回 控制 。 可 以 使 用 中 断 来 告知 消息 已 经 
到 达 。 然 而 ,中 断 方式 编程 困难 ,并 且 速 度 慢 , 所 以 对 于 接收 者 ,更 好 的 方法 是 使 用 一 个 过 程 
poll 轮 询 到 达 的 消息 。 该 过 程 报告 是 否 有 消息 在 等 待 。 若 是 ,调用 者 可 调用 get_message， 
返回 第 一 个 到 达 的 消息 。 

另 一 种 可 选 的 机 制 是 ,在 接收 者 进程 的 地 址 空间 中 , 若 一 个 消息 的 到 达 会 引起 一 个 新 线 
程 的 创建 ,该 线程 称 为 弹出 式 线程 (pop-up thread) 。 该 线程 运行 一 个 预定 义 的 过 程 , 其 参数 
是 指向 进来 消息 的 指针 。 处 理 完 该 消息 之 后 ,该 线程 直接 退出 并 自动 被 撤销 。 

对 该 机 制 的 一 种 改进 是 ,在 中 断 处 理 程序 中 直接 运行 接收 者 代码 ,避免 创建 弹出 式 线 
程 。 同 时 ,消息 自身 可 以 带 有 该 处 理 程序 的 句柄 (handler) , 当 消息 到 达 时 ,只 在 少数 几 个 指 
令 中 可 以 调用 处 理 程序 。 其 优点 是 再 也 不 需要 进行 复制 了 。 处 理 程序 从 接口 板 获 取消 息 并 
上 且 即 时 处 理 。 该 方式 称 为 主动 消息 (active message) 。 由 于 每 条 消息 中 都 有 处 理 程序 的 句 
柄 ,主动 消息 方式 只 能 在 发 送 者 和 接收 者 彼此 完全 信任 的 条 件 下 工作 。 


8.2.4 远程 过 程 调用 


尽管 消息 传递 模型 给 构造 多 计算 机 操作 系统 提供 了 一 种 便利 方式 ,但 是 它 存 在 明显 的 
缺陷 : 构造 所 有 通信 的 范 型 (paradigm) 都 是 输入 输出 ,过 程 Send 和 Receive 基本 上 在 做 LI/ 
人 Q 王 作 。 

远程 过 程 调用 (Remote Procedure Call，RPC ) 的 方法 能 够 解决 上 述 缺 陷 , 其 基本 思想 
是 ,允许 程序 调用 位 于 其 他 CPU 中 的 过 程 , 当 机 器 1 的 进程 调用 机 器 2 的 过 程 时 ,在 机 器 1 
中 的 调用 进程 被 挂 起 ,在 机 器 2 中 被 调用 的 过 程 执行 。 在 参数 中 传递 从 调用 者 到 被 调用 者 
的 信息 ,并 且 可 在 过 程 的 处 理 结 果 中 返回 信息 ,根本 不 存在 对 程序 员 可 见 的 消息 传递 或 
I/O。 这 种 技术 已 经 成 为 大 量 多 计算 机 软件 的 基础 。 习 惯 上 , 称 发 出 调用 的 过 程 为 客户 机 ， 
而 称 被 调用 的 过 程 为 服务 器 。 

RPC 尽 可 能 使 远程 过 程 调用 和 本 地 调用 一 样 。 在 最 简单 的 情形 下 ,要 调用 一 个 远程 过 
程 , 客 户 程序 必须 被 绑 定 在 一 个 称 为 客户 端 桩 (client stub) 的 小 型 库 过 程 上 , 它 在 客户 机 地 
址 空间 中 代表 服务 器 过 程 。 类 似 地 ,服务 器 程序 也 绑 定 在 一 个 称 为 服务 器 端 桩 (server 
stub) 的 过 程 上 。 进 行 RPC 的 实际 步骤 如 图 8-20 所 示 ,第 1 步 是 客户 机 调用 客户 端 桩 。 该 
调用 是 一 个 本 地 调用 ,其 参数 以 通常 方式 压 人 栈 内 ; 第 2 步 是 客户 端 桩 将 有 关 参 数 打包 成 
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一 条 消息 ,并 进行 系统 调用 来 发 出 该 消息 。 将 参数 打包 的 过 程 称 为 编排 (marshaling); 第 3 
步 是 内 核 将 该 消息 从 客户 机 发 给 服务 器 ; 第 4 步 是 内 核 将 接收 进来 的 消息 传递 给 服务 器 端 
桩 (通常 服务 器 端 桩 已 经 提前 调用 了 Receive); 第 5 步 是 服务 器 端 桩 调用 服务 器 过 程 。 应 
答 则 是 在 相反 的 方向 沿 着 同样 的 步骤 进行 。 

客户 机 CPU 服务 器 CPU 


























网 络 
图 8-20 进程 RPC 的 步骤 


由 用 户 编 写 的 客户 机 过 程 只 进行 对 客户 端 桩 的 正常 (本 地 ) 调 用 ,而 客户 端 桩 与 服务 器 
过 程 同名 。 由 于 客户 机 过 程 和 客户 端 桩 在 同一 个 地 址 空间 ,所 以 有 关 参 数 以 正常 方式 传递 。 
类 似 地 ,服务 器 过 程 由 其 所 在 的 地 址 空间 中 的 一 个 过 程 用 它 所 期 望 的 参数 进行 调用 。 通 过 
这 种 方式 ,不 采用 带 有 Send 和 Receive 的 IVO ,而 是 通过 伪造 一 个 普通 的 过 程 调用 实现 远程 
通信 。 


8.2.5 分 布 式 共 享 存储 器 


在 分 布 式 共 享 存储 器 (Distributed Shared Memory,DSM) 系统 中 ,每 台 计 算 机 有 其 自 
己 的 虚拟 内 存 和 页 表 , 一 个 CPU 在 一 个 它 并 不 拥有 的 页 面 上 执行 LOAD 和 STORE 指令 
时 ,会 陷入 到 操作 系统 当中 。 然 后 操作 系统 对 该 页 面 进行 定位 ,并 请 求 当 前 持 有 该 页 面 的 
CPU 解除 对 该 页 面 的 映射 并 通过 互联 网 发 送 该 页 面 。 在 页 面 到 达 时 ,页 面 被 映射 出 来 ,于 
是 出 错 指令 重新 启动 。 事 实 上 ,操作 系统 只 是 从 远程 RAM 中 而 不 是 从 本 地 磁盘 中 满足 了 
这 个 缺 页 异常 。 对 用 户 而 言 ,机 器 看 起 来 拥有 共享 存储 器 。 

实际 的 共享 存储 器 和 DSM 之 间 的 差别 如 图 8-21 所 示 , 图 中 灰色 部 分 表示 共享 存储 
器 。 在 图 8-21(a) 中 ,是 一 台 配 有 通过 硬件 实现 的 物理 共享 存储 器 的 真正 的 多 处 理 机 。 
在 图 8-21(b) 中 ,是 由 操作 系统 实现 的 DSM。 在 图 8-21(c) 中 ,是 另 一 种 形式 的 共享 存储 器 ， 
通过 更 高 层次 的 软件 实现 。 

在 DSM 系统 中 ,地 址 空间 被 划分 为 页 面 (page) ,这些 页 面 分 布 在 系统 的 所 有 节点 上 。 
当 一 个 CPU 引用 一 个 非 本 地 的 地 址 时 ,就 产生 一 个 陷入 ,DSM 软件 调 取 包含 该 地 址 的 页 面 
并 重新 启动 出 错 指 令 。 该 指令 现在 可 以 完整 地 执行 了 。 其 概念 如 图 8-22(a) 所 示 , 该 系统 有 
16 个 页 面 的 地 址 空间 ,4 个 节点 ,每 个 节点 能 持 有 6 个 页 面 。 

如 果 CPU 0 引用 的 指令 或 数据 在 页 面 0.2、5 或 9 中 ,那么 引用 在 本 地 完成 。 引 用 其 他 
的 页 面 会 导致 陷入 。 例 如 ,CPU 0 对 页 面 10 的 引用 会 导致 陷入 到 DSM 软件 ,该 软件 把 页 
面 10 从 CPU 1 移动 到 CPU 0, 如 图 8-22(b) 所 示 。 
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PC1 PC2 PC2 PCL PC2 
应 用 应 用 应 用 应 用 应 用 
运行 时 运行 时 运行 时 运行 时 运行 时 
操作 操作 操作 操作 操作 
硬件 硬件 硬件 硬件 硬件 
(a) 硬件 (b) 操作 系统 (9) 用 户 层 软件 
图 8-21 实现 共享 存储 器 的 不 同 层次 
1. 复制 


对 基本 系统 的 一 个 改进 就 是 复制 那些 只 读 页 面 ,如 程序 代码 、 只 读 常量 或 只 读数 据 结 
构 , 它 可 以 明显 地 提高 性 能 。 例 如 ,假设 图 8-22 中 的 页 面 10 是 一 段 程序 代码 , 若 CPU 0 对 
它 引 用 ,可 以 将 一 个 副本 送 往 CPU 0, 从 而 不 打扰 CPU 1 的 原 有 存储 器 ,如 图 8-22(c) 所 示 。 
在 这 种 方式 中 ,CPU 0 和 CPU 1 两 者 可 以 按 需 要 同时 引用 页 面 10, 而 不 会 产生 由 于 引用 不 
存在 的 存储 器 页 面 导致 的 陷入 。 

另 一 种 可 能 是 ,不 仅 复制 只 读 页 面 ,而 且 复 制 所 有 的 页 面 。 只 读 页 面 的 复制 和 可 读 写 页 
面 的 复制 之 间 不 存在 差别 。 但 是 ,如 果 一 个 被 复制 的 页 面 突 然 被 修改 了 ,就 必须 采取 必要 的 
措施 来 避免 多 个 不 一 致 的 副本 存在 。 下 面 将 介绍 如 何 避 免 不 一 致 性 。 


2. 伪 共享 


DSM 系统 与 多 处 理 机 在 某 些 关键 方式 上 类 似 。 在 这 两 种 系统 中 , 当 非 本 地 存储 器 字 被 
引用 时 ,包含 该 字 的 一 块 内 存 从 所 在 的 机 器 上 被 取出 ,并 被 放 到 进行 引用 的 (分 别 是 内 存储 
器 或 高 速 缓存 ) 相 关机 器 上 ,其 中 ,一 个 重要 的 设计 问题 是 一 块 内 存 应 该 取 多 大 。 在 多 处 理 
机 中 ,为 了 避免 占用 总 线 传 输 的 时 间 过 长 ,其 高 速 缓存 块 的 大 小 通常 是 32B 或 者 64B。 在 
DSM 系统 中 , 块 的 单位 必须 是 页 面 大 小 的 整数 倍 ( 因 为 MMU 以 页 面 方式 工作 ) ,不 过 可 以 
是 1 个 .2 个 .4 个 或 者 更 多 个 页 面 。 

对 于 DSM 而 言 , 由 于 页 面 较 大 ,其 突出 的 优点 是 ,因为 网 络 传输 的 启动 时 间 是 相当 长 
的 ,所 以 传递 4096B 并 不 比 传递 1024B 多 花费 多 长 时 间 。 特 别 是 在 有 大 量 的 地 址 空间 需要 
移动 时 ,通过 采用 大 单位 的 数据 传输 ,通常 可 减少 传输 的 次 数 。 此 特性 是 非常 重要 的 ,因为 
很 多 程序 表现 出 引用 上 的 局 限 性 , 即 如 果 一 个 程序 引用 了 某 页 中 的 一 个 字 , 很 可 能 在 不 久 的 
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一 一 存储 器 








CPU3 




















网 络 
(a) 分 布 在 4 个 CPU 中 的 地 址 空间 页 面 























































































































of [2j[s 1][3|][e 4][7] 13] [1s 
9] [Do 8 12] [4 
CPU0 CPU1 CPU2 CPU3 






















































































CPU 3 





(c) 页 面 10 是 只 读 的 并 且 使 用 了 复制 的 情形 
图 8-22 DSM 系统 中 页 面 的 访问 


将 来 还 会 引用 同一 个 页 面 中 其 他 的 字 。 

另 一 方面 ,大 页 面 的 传输 造成 网 络 长 期 占用 ,阻塞 了 其 他 进程 引起 的 故障 。 另 外 ,过 大 
的 有 效 页 面 引起 了 伪 共享 (false sharing) 问 题 。 如 图 8-23 所 示 ,一 个 页 面 中 含有 两 个 无 关 
共享 变量 A 和 B。 进 程 1 大 量 使 用 A ,进行 读 写 操作 ; 进程 2 经 常 使 用 B。 在 这 种 情况 下 ， 
含有 这 两 个 变量 的 页 面 将 在 两 台 机 器 中 来 回 地 传送 。 

尽管 这 些 变量 是 无 关 的 ,但 它们 碰巧 在 同一 个 页 面 内 ,所 以 当 某 个 进程 使 用 其 中 一 个 变 
量 时 , 它 也 将 得 到 另 一 个 。 有 效 页 面 越 大 ,发 生 伪 共 享 的 可 能 性 也 越 高 ; 相反 ,有 效 页 面 越 
小 ,发 生 伪 共 享 的 可 能 性 也 越 少 。 在 普通 的 虚拟 内 存 系统 中 不 存在 类 似 的 现象 。 

解决 该 问题 的 方法 是 采用 智能 编译 器 将 变量 放 在 相应 的 地 址 空间 中 来 减少 伪 共 享 , 从 
而 改善 其 性 能 。 但 是 ,如 果 伪 共享 中 节点 1 使 用 某 个 数组 中 的 一 个 元 素 , 而 节点 2 使 用 同一 
个 数组 中 的 另 一 个 元 素 ,那么 即使 再 智能 的 编译 器 也 没有 办 法 消除 伪 共 享 问题 。 
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CPU 1 CPU2 
A 和 B 是 不 相关 的 共享 变量 ， 
Ey -一 一 一 它们 恰巧 在 同一 个 页 面 
闪 蛙 
页 面 A a 
B B 
使 用 变量 A 使 用 变量 B 
的 代码 的 代码 
网 络 
图 8-23 ”含有 两 个 无 关 变量 的 页 面 的 伪 共 享 
3. 实现 顺序 一 致 性 


如 果 不 对 可 写 页 面 进行 复制 ,那么 实现 一 致 性 是 没有 问题 的 。 每 个 可 写 页 面具 有 一 个 
副本 ,在 需要 时 动态 地 来 回 移动 。 由 于 并 不 是 总 能 提前 知道 哪些 页 面 是 可 写 的 ,所 以 在 许多 
DSM 系统 中 , 当 一 个 进程 试图 读 一 个 远程 页 面 时 , 则 复制 一 个 本 地 副本 ,在 本 地 和 远程 各 自 
对 应 的 MMU 中 建立 只 读 副本 。 只 要 所 有 的 引用 都 做 读 操作 ,那么 一 切 正常 。 

但 是 ,如 果 有 一 个 进程 试图 在 一 个 被 复制 的 页 面 上 写 入 ,就 会 出 现 潜在 的 一 致 性 问题 ， 
因为 只 修改 一 个 副本 却 不 管 其 他 副本 的 做 法 是 不 能 接受 的 。 这 种 情形 与 在 多 处 理 中 一 个 
CPU 试图 修改 存在 于 多 个 高 速 缓存 中 的 一 个 字 的 情况 有 些 类 似 之 处 。 在 多 处 理 机 中 的 解 
决 方案 是 ,要 进行 写 的 CPU 首先 将 一 个 信号 放 到 总 线 上 ,通知 其 他 CPU 丢弃 该 高 速 缓存 
块 的 副本 。DSM 系统 以 同样 的 方式 工作 。 在 对 一 个 共享 页 面 进 行 写 人 之 前 , 先 向 所 有 持 有 
该 页 面 副 本 的 CPU 发 出 一 条 消息 ,通知 它们 解除 映射 并 丢弃 该 页 面 。 在 其 所 有 解除 映射 
等 工作 完成 之 后 ,该 CPU 便 可 以 进行 写 操作 了 。 

在 有 详细 约束 的 情况 下 ,有 可 能 允许 可 写 页 面 的 多 个 副本 存在 。 一 种 方法 是 允许 一 个 
进程 获得 在 部 分 虚拟 地 址 空间 上 的 一 把 锁 , 然 后 在 被 锁 住 的 存储 空间 中 进行 多 个 读 写 操作 。 
在 该 锁 被 释放 时 ,产生 的 修改 可 以 传播 到 其 他 副本 上 去 。 只 要 在 一 个 给 定 的 时 刻 只 有 一 个 
CPU 能 锁 住 某 个 页 面 ,这 样 的 机 制 就 能 保持 一 致 性 。 

另 一 种 方法 是 , 当 一 个 潜在 可 写 的 页 面 被 第 一 次 真正 写 和 人 时 ,制作 一 个 “干净 ?的 副本 并 
保存 在 发 出 写 操作 的 CPU 上 。 然 后 可 在 该 页 面 上 加 锁 ,更 新 页 面 , 并 释放 锁 。 稍 后 , 当 一 
个 远程 机 器 上 的 进程 试图 获得 该 页 面 上 的 锁 时 ,先前 进行 写 操作 的 CPU 将 该 页 面 的 当前 
状态 与 “干净 ”副本 进行 比较 并 构造 一 个 有 关 所 有 已 修改 的 字 的 列表 ,该 列表 接着 被 送 往 获 
得 锁 的 CPU, 这 样 就 可 以 更 新 其 副本 页 面 而 不 用 废弃 它 。 


8.2.6 多 计算 机 调度 


在 多 处 理 机 中 ,所 有 的 进程 都 在 同一 个 存储 器 中 。 当 某 个 CPU 完成 其 当前 任务 后 , 它 
选择 一 个 进程 并 运行 。 理 论 上 ,所 有 的 进程 都 是 潜在 的 候选 者 。 而 多 计算 机 与 多 处 理 机 情 
况 就 大 不 相同 ,每 个 节点 有 其 自己 的 存储 器 和 进程 集合 。 若 CPU 1 不 事先 花费 相当 大 的 工 
作 量 去 获得 位 于 节点 4 上 的 一 个 进程 ,CPU 1 是 不 能 突然 决定 运行 该 进程 的 。 该 差别 说 明 
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在 多 计算 机 上 的 调度 较为 容易 ,但 是 将 进程 分 配 到 节点 上 的 工作 更 为 重要 。 

多 计算 机 调度 与 多 处 理 机 调度 有 些 类 似 ,但 是 并 不 是 后 者 的 所 有 算法 都 能 适用 于 前 者 。 
最 简单 的 多 处 理 机 算法 , 即 维护 就 绪 进 程 的 一 个 中 心 链表 ,就 不 适用 于 多 计算 机 的 调度 , 因 
为 每 个 进程 只 能 在 其 当前 所 在 的 CPU 上 运行 。 不 过 , 当 一 个 新 进程 被 创建 时 ,可 以 从 平衡 
负载 的 考虑 出 发 ,选择 将 其 放 在 相应 的 计算 机 中 。 

由 于 每 个 节点 拥有 自己 的 进程 ,因此 可 以 应 用 任何 本 地 调度 算法 。 但 是 , 仍 需要 采用 多 
处 理 机 的 群 调度 ,因为 在 多 计算 机 中 有 唯一 的 要 求 , 即 有 一 个 初始 的 协议 来 决定 哪个 进程 在 
哪个 时 间 槽 中 运行 ,以 及 用 于 协调 时 间 槽 的 起 点 的 方法 。 


8.2.7 负载 均衡 


对 于 多 计算 机 调度 ,一 旦 一 个 进程 被 指定 给 了 一 个 节点 ,就 可 以 使 用 任何 本 地 调度 
算法 ,除非 正在 使 用 群 调度 。 不 过 ,一 旦 一 个 进程 被 指定 给 某 个 节点 ,就 不 再 有 什么 可 控 
制 的 了 ,因此 ,重要 的 决策 是 哪个 进程 被 指定 给 哪个 节点 。 这 与 多 处 理 机 系统 相反 ,在 多 
处 理 机 系统 中 所 有 的 进程 都 在 同一 个 存储 器 中 ,可 以 随意 调度 到 任何 CPU 上 运行 。 因 此 ， 
关键 是 采用 有 效 的 处 理 器 分 配 算法 (processor allocation algorithm) 把 进程 分 配 到 各 个 节 
点 。 不 同 的 分 配 算法 分 别 有 各 自 的 前 提 和 目标 ,可 知 的 进程 属性 包括 CPU 需求 .存储 器 使 
用 以 及 与 每 个 其 他 进程 的 通信 量 等 。 可 能 的 目标 包括 最 小 化 由 于 缺少 本 地 工作 而 浪费 的 
CPU 周期 .最 小 化 总 的 通信 带宽 以 及 确保 用 户 和 进程 公平 性 等 。 下 面 介绍 几 个 CPU 分 配 
算法 。 


1. 图 论 确 定 算法 


假设 系统 包含 已 知 CPU 和 存储 器 需求 进程 ,并 给 出 每 对 进程 之 间 的 平均 流量 的 已 知 
和 矩阵。 如 果 进 程 的 数量 大 于 CPU 的 数量 A, 则 必须 把 若干 个 进程 分 配给 每 个 CPU。 其 思想 
是 以 最 小 的 网 络 流量 完成 该 分 配 工作 。 

该 系统 可 以 采用 一 个 带 权 的 图 表示 ,每 个 顶点 表示 一 个 进程 ,而 每 条 弧 代 表 两 个 进程 之 
间 的 消息 流 。 在 数学 上 ,该 问题 简化 为 在 特定 的 限制 条 件 下 (例如 ,每 个 子 图 对 整个 CPU 
和 存储 器 的 需求 低 于 某 些 限制 ) ,寻找 一 个 将 图 分 割 为 & 个 互 不 连接 的 子 图 的 方法 。 对 于 每 
个 满足 限制 条 件 的 解决 方案 ,完全 在 单个 子 图 内 的 弧 代表 了 机 器 内 部 的 通信 ,可 以 忽略 ,从 
一 个 子 图 通 向 另 一 个 子 图 的 弧 代 表 网 络 通 信 。 目 标 是 找 出 可 以 使 网 络 流量 最 小 ,同时 满足 
所 有 的 限制 条 件 的 分 割 方 法 。 例 如 ,图 8-24 给 出 了 一 个 有 9 个 进程 的 系统 ,这 9 个 进程 是 
进程 A 至 工 ,每 个 弧 上 标 有 两 个 进程 之 间 的 平均 通信 和 负载 (以 Mb/s 为 单位 ) 。 

在 图 8-24(a) 中 ,将 进程 A\E 和 G 的 图 划分 在 节点 1 上 ,进程 BF 和 HH 划分 在 节点 2 
上 ,而 进程 C.D 和 了 工 划分 在 节点 3 上 。 整 个 网 络 流量 是 被 切割 (虚线 ) 弧 上 的 流量 之 和 , 即 
30 个 单位 。 在 图 8-24(b) 中 .采用 另 一 种 不 同 的 划分 方法 ,只 有 28 个 单位 的 网 络 流量 。 若 
该 方法 满足 所 有 的 存储 器 和 CPU 的 限制 条 件 ,那么 该 方法 就 是 更 好 的 选择 ,因为 它 需要 较 
少 的 通信 流量 。 

该 算法 的 思想 是 在 满足 特定 的 限制 条 件 下 尽量 寻找 紧 艳 合 ( 秘 内 高 流量 ) 的 簇 
(cluster) ,并 且 与 其 他 的 徐 有 较 少 的 交互 ( 簇 外 低 流 量 )。 
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(a) 划分 方法 之 一 (b) 划分 方法 之 二 
图 8-24 将 9 个 进程 分 配 到 3 个 节点 上 的 两 种 方法 


2. 发 送 者 发 起 的 分 布 式 启发 算法 


在 一 些 分 布 式 算法 中 ,有 的 采用 发 送 者 发 起 的 分 布 式 启发 算法 , 当 进 程 创建 时 , 它 就 运 
行 在 创建 的 节点 上 ,除非 该 节点 过 载 了 。 过 载 节点 的 度量 可 能 涉及 太 多 的 进程 .过 大 的 工作 
集 或 者 其 他 度量 。 如 果 过 载 了 ,该 节点 随机 选择 另 一 个 节点 并 询问 它 的 负载 情况 。 如 果 被 
探查 的 节点 负载 低 于 某 个 阔 值 ,就 将 新 的 进程 送 到 该 节点 上 ;* 如 果 不 是 , 则 选择 另 一 个 节点 
探查 。 在 N 次 探查 之 内 ,如 果 没 有 找到 合适 的 主机 ,算法 就 终止 , 且 进 程 继续 在 原 有 的 节点 
上 运行 。 整 个 算法 的 思想 是 负载 较 重 的 节点 试图 忆 掉 超额 的 工作 。 图 8-25(a) 描 述 了 发 送 
者 发 起 的 负载 均衡 。 
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(a) 过 载 的 节点 寻找 可 以 接收 进程 的 轻 载 节点 (b) 一 个 节点 寻找 工作 做 
8-25 发 送 者 发 起 的 分 布 式 启发 算法 


该 算法 的 缺点 是 ,在 负载 重 的 条 件 下 ,所 有 的 节点 都 会 持续 地 对 其 他 节点 进行 探查 , 徒 
劳 地 试图 找到 一 个 愿意 接收 更 多 工作 的 节点 。 因 为 几乎 没有 进程 能 够 被 卸载 ,持续 地 探查 
会 带 来 巨大 的 开销 。 


3. 接收 者 发 起 的 分 布 式 启发 算法 
上 述 的 算法 是 由 一 个 过 载 的 发 送 者 发 起 的 ,其 互补 算法 是 由 一 个 轻 载 的 接收 者 发 起 的 ， 
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如 图 8-25(b) 所 示 。 在 该 算法 中 ,只 要 有 一 个 进程 结束 ,系统 就 检查 是 否 有 足够 的 工作 可 
做 。 如 果 不 是 , 它 随机 选择 某 个 节点 并 要 求 它 提 供 工作 。 如 果 该 节点 没有 可 提供 的 工作 ,会 
接着 询问 第 二 个 节点 ,然后 是 第 三 个 节点 。 如 果 在 N 次 探查 之 后 ,还 是 没有 找到 工作 ,该 节 
点 暂时 停止 询问 ,去 做 任何 已 经 安排 好 的 工作 ,而 在 下 一 个 进程 结束 之 后 该 节点 会 再 次 进行 
询问 。 如 果 没 有 可 做 的 工作 ,该 节点 就 开始 空闲 。 在 经 过 固定 的 时 间 间 隔 之 后 , 它 又 开始 
探查 。 

该 算法 的 优点 是 在 关键 时 刻 不 会 对 系统 增加 额外 的 负担 。 发 送 者 发 起 的 算法 在 节点 最 
不 能 够 容忍 时 (此 时 系统 已 是 负载 相当 重 了 ) 去 做 大 量 的 探查 工作 。 当 系统 负载 很 重 时 ,一 
个 节点 处 于 非 充分 工作 状态 的 机 会 是 很 小 的 。 但 是 对 接收 者 发 起 算法 , 当 这 种 情况 发 生 时 ， 
它 就 会 较 容易 地 找到 可 承接 的 工作 。 当 然 ,如 果 没 有 什么 工作 可 做 ,接收 者 发 起 算法 也 会 制 
造 出 大 量 的 探查 流量 。 不 过 ,在 系统 轻 载 时 增加 系统 的 负载 要 远 远 好 于 在 系统 过 载 时 再 增 
加 负载 。 

同时 ,可 以 将 这 两 种 算法 组 合 起 来 , 当 节 点 工作 太 多 时 可 以 尝试 印 掉 一 些 工作 ,而 在 工 
作 不 多 时 可 以 尝试 得 到 一 些 工作 。 此 外 ,节点 也 许可 以 通过 保留 一 份 以 往 探查 的 历史 记录 
(用 以 确定 是 否 有 节点 经 常 处 于 轻 载 或 过 载 状 态 ) 来 对 随机 轮 询 的 方法 进行 改进 。 可 以 首先 
尝试 这 些 节 点 中 的 某 一 个 ,这 取决 于 发 起 者 是 试图 印 掉 工 作 还 是 获得 工作 。 


6.3 虚拟 化 


在 某 些 环境 下 ,一 个 机 构 拥 有 多 计算 机 系统 ,但 事实 上 却 并 不 真正 需要 它 。 例 如 ,一 个 
公司 同时 拥有 一 个 电子 邮件 服务 器 、 一 个 Web 服务 器 、 一 个 FTP 服务 器 、 一 些 电 子 商 务 服 
务 器 和 其 他 服务 器 。 这 些 服务 器 运行 在 同一 个 设备 架 上 的 不 同 计算 机 中 ,彼此 之 间 以 高 速 
网 络 连接 , 即 组 成 一 个 多 计算 机 系统 。 在 有 些 情况 下 , 巾 于 单独 的 一 台 计算 机 难以 承受 这 样 
的 负载 ,这 些 服务 器 需要 运行 在 不 同 的 计算 机 上 。 但 是 在 更 多 其 他 的 情况 下 ,这 些 服务 器 不 
能 运行 在 同一 台 计 算 机 上 最 重要 的 原因 是 可 靠 性 (reliability) : 现实 中 操作 系统 不 可 能 长 时 
间 连 续 无 故障 地 运行 。 把 各 个 服务 器 放 在 不 同 计算 机 上 ,即使 其 中 的 一 个 服务 器 崩溃 了 ,其 
他 的 服务 器 也 不 会 受到 影响 。 虽 然 这 样 做 能 够 达到 容错 的 要 求 ,但 是 该 解决 方法 成 本 过 高 
且 难 以 管理 ,因为 涉及 的 计算 机 太 多 。 

采用 虚拟 化 (virtualization) 技 术 可 以 解决 上 述 问 题 。 该 技术 允许 一 台 计算 机 中 存在 多 
个 虚拟 机 ,每 一 个 虚拟 机 可 以 运行 不 同 的 操作 系统 。 该 方法 的 优点 是 ,一 个 虚拟 机 上 的 错误 
不 会 自动 地 使 其 他 虚拟 机 崩溃 。 在 虚拟 化 系统 中 ,不 同 的 服务 器 可 以 运行 在 不 同 的 虚拟 机 
中 ,因此 保持 了 多 计算 机 系统 局 部 性 错误 的 模型 ,但 是 代价 更 低 , 也 更 易于 维护 。 

如 果 运 行 所 有 虚拟 机 的 服务 器 崩溃 了 ,其 结果 比 单独 一 个 专用 服务 器 崩溃 要 严重 得 多 。 
但 是 虚拟 化 技术 能 够 起 作用 的 原因 在 于 大 多 数 服务 器 停机 的 原因 不 是 硬件 故障 ,而 是 因为 
腔 肿 .不 可 靠 有 漏洞 的 软件 ,特别 是 操作 系统 。 使 用 虚拟 化 技术 ,唯一 一 个 运行 在 内 核 态 的 
软件 是 管理 程序 (hypervisor) ,其 代码 量 比 一 个 完整 操作 系统 的 代码 量 低 两 个 数量 级 ,也 就 
意味 着 软件 中 的 漏洞 数 也 会 低 两 个 数量 级 。 

除了 强大 的 隔离 性 ,在 虚拟 机 上 运行 软件 还 有 其 他 的 优点 。 其 中 之 一 就 是 减少 了 物理 
机 器 的 数量 从 而 节省 了 硬件 .电源 的 开支 并 且 占 用 更 少 的 空间 。 对 于 一 个 公司 ,例如 , 亚 马 
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还 (Amazom) ,微软 (Microsoft) 以 及 谷歌 (Google) ,它们 拥有 成 千 上 万 的 服务 器 运行 不 同 的 
任务 ,减少 它们 的 数据 中 心 对 物理 机 器 的 需求 意味 着 节省 一 大 笔 开 支 。 例 如 ,在 大 公司 里 ， 
不 同 的 部 门 或 小 组 想 出 了 一 个 有 创新 的 想法 ,然后 去 买 一 台 服 务 器 来 实现 它 。 如 果 创 新 想 
法 不 断 产 生 ,就 需要 成 百 上 千 的 服务 器 ,公司 的 数据 中 心 就 会 扩张 。 同 时 把 一 款 软件 移动 到 
已 有 的 机 器 上 通常 会 很 困难 ,因为 每 一 款 软件 都 需要 一 个 特定 版 本 的 操作 系统 、 软 件 自身 的 
函数 库 ,配置 文件 等 。 使 用 虚拟 机 ,每 款 软件 都 可 以 携带 属于 自己 的 环境 。 

虚拟 机 的 另 一 个 优点 在 于 检查 点 和 虚拟 机 的 迁移 (例如 ,在 多 个 服务 器 间 迁 移 以 达到 负 
载 平 衡 ) 比 在 普通 的 操作 系统 中 进行 进程 迁移 更 加 容易 。 在 后 一 种 情况 下 ,相当 数量 的 进程 
关键 状态 信息 都 被 保存 在 操作 系统 表 中 ,包括 打开 文件 、 和 警报 \ 信 号 处 理 函数 等 有 关 的 信息 。 
当 迁 移 一 个 虚拟 机 的 时 候 , 需 要 移动 的 仅仅 是 内 存 映 像 ,因为 在 移动 内 存 映像 的 同时 所 有 的 
操作 系统 表 也 会 移动 。 

同时 ,虚拟 机 的 一 个 重要 应 用 是 软件 开发 。 一 个 程序 员 想 要 确保 他 的 软件 在 Windows 
98、Windows 2000、Windows XP、Windows Vista、 多 种 Linux 版 本 、FreeBSD .OpenBSD、 
NetBSD 和 Mac OS X 上 都 可 以 正常 运行 ,他 不 需要 有 多 台 计算 机 以 及 在 不 同 的 计算 机 上 安 
装 不 同 的 操作 系统 。 相 反 , 他 只 需要 在 一 台 物 理 机 上 创建 一 些 虚拟 机 ,然后 在 每 个 虚拟 机 上 
安装 不 同 的 操作 系统 。 当 然 , 该 程序 员 可 以 给 他 的 磁盘 分 区 ,然后 在 每 个 分 区 上 安装 不 同 的 
操作 系统 ,但 是 这 种 方法 太 困 难 。 首 先 ,不 论 磁 盘 的 容量 有 多 大 ,标准 的 PC 只 支持 4 个 主 
分 区 。 其 次 ,尽管 在 引导 块 上 可 以 安装 一 个 多 引导 程序 ,但 要 运行 另 一 个 操作 系统 就 必须 重 
启 计算 机 。 使 用 虚拟 机 ,所 有 的 操作 系统 可 以 同时 运行 。 

有 两 种 虚拟 化 的 方法 ,一 种 是 管理 程序 ,又 称 为 工 型 管理 程序 ,如 图 1-12 所 示 ; 另 一 种 
是 下 型 管理 程序 ,如 图 1-13 所 示 。 


8.3.1 准 虚拟 化 


运行 在 工 型 和 开 管 理 程序 之 上 的 都 是 没有 修改 过 的 客户 操作 系统 ,但 是 这 两 类 管理 程 
序 都 存在 性 能 问题 。 另 一 种 处 理 方法 是 更 改 客户 操作 系统 的 源 代码 ,从 而 略 过 敏感 指令 的 
执行 , 转 而 执行 管理 程序 调用 (hypervisor call) 。 事 实 上 ,对 于 客户 操作 系统 就 像 是 用 户 程 
序 调用 操作 系统 (管理 程序 ) 一 样 。 当 采用 这 种 方法 时 ,管理 程序 必须 定义 由 过 程 调用 集合 
组 成 的 接口 以 供 客户 操作 系统 使 用 。 该 过 程 调用 集合 实际 上 形成 了 API, 尽 管 这 个 接口 是 
供 客 户 操作 系统 而 不 是 应 用 程序 使 用 的 。 

再 进一步 ,从 操作 系统 中 移 除 所 有 的 敏感 指令 ,只 让 操作 系统 调用 管理 程序 调用 来 获得 
诸如 1/O 操作 等 系统 服务 ,通过 这 种 方式 就 已 经 把 管理 程序 变 成 了 一 个 微 内 核 , 如 图 1-12 
和 图 1-13 所 示 。 部 分 或 全 部 敏感 指令 被 有 意 移 除 的 客户 操作 系统 称 为 准 虚拟 化 的 
(paravirtualized) 。 仿 真 特殊 的 机 器 指令 需要 调用 管理 程序 ,然后 仿真 复杂 指令 的 精确 语 
义 。 让 客户 操作 系统 直接 调用 管理 程序 (或 者 微 内 核 ) 完 成 /O 操作 等 任务 会 更 好 。 之 前 
的 管理 程序 都 选择 模拟 完整 的 计算 机 ,其 主要 原因 在 于 客户 操作 系统 的 源 代码 不 可 获得 (如 
Windows) 或 源 代码 种 类 太 多 (如 Linux)。 也 许 在 将 来 ,管理 程序 / 微 内 核 的 API 接口 可 以 
标准 化 ,然后 后 续 的 操作 系统 都 会 调用 该 API 接口 而 不 是 执行 敏感 指令 。 这 样 将 使 得 虚拟 
化 机 技术 更 容易 被 支持 和 使 用 。 

全 虚拟 化 和 准 虚拟 化 之 间 的 区 别 如 图 8-26 所 示 。 其 中 ,有 两 个 虚拟 机 运行 在 支持 VT 
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技术 的 硬件 上 。 左 边 的 客户 操作 系统 是 一 个 没有 经 过 修改 的 Windows 版 本 。 当 执行 敏感 
指令 的 时 候 ,硬件 陷入 到 管理 程序 ,由 管理 程序 仿真 执行 它 , 随 后 返回 。 右 边 的 客户 操作 系 
统 是 一 个 经 过 修改 的 Linux 版 本 ,其 中 不 含 敏感 指令 。 当 它 需要 进行 IO 操作 或 修改 重要 
内 部 寄存 器 (如 指向 页 表 的 寄存 器 ) 时 ,调用 管理 程序 例 程 来 完成 这 些 工 作 , 就 像 在 标准 
Linux 系统 中 应 用 程序 执行 操作 系统 调用 一 样 。 
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图 8-26 支持 全 虚拟 化 和 准 虚拟 化 的 管理 程序 


如 图 8-26 所 示 ,管理 程序 被 一 条 虚线 分 成 两 个 部 分 ,其 实 ,只 有 一 个 程序 在 硬件 上 运 
行 。 其 中 ,一 部 分 用 来 解释 陷入 的 敏感 指令 ,在 这 种 情况 下 ,请 参照 Windows 一 边 ; 男 一 部 
分 用 来 执行 管理 程序 例 程 ,在 图 8-26 中 ,后 一 部 分 被 标记 为 “ 微 内 核 ”。 如 果 管 理 程序 只 是 
用 来 运行 准 虚 拟 化 的 客户 操作 系统 ,就 不 需要 对 敏感 指令 进行 仿真 ,这 样 , 就 获得 了 一 个 真 
正 的 微 内 核 。 该 微 内 核 只 提供 最 基本 的 服务 ,诸如 进程 分 派 , 管 理 MMU 等 。 

对 客户 操作 系统 进行 准 虚拟 化 时 ,所 有 的 敏感 指令 都 被 管理 程序 例 程 所 代替 , 当 内 核 需 
要 执行 一 些 敏 感 操作 时 会 转 而 调用 特殊 的 例 程 。 这 些 特殊 的 例 程 称 作 VMI( 虚 拟 机 接口 )， 
形成 的 低层 与 硬件 或 管理 程序 进行 交互 。 这 些 例 程 被 设计 得 通用 化 ,不 依赖 于 硬件 或 特定 
的 管理 程序 。 

该 技术 的 一 个 示例 如 图 8-27 所 示 , 是 一 个 准 虚 拟 化 的 Linux 版 本 , 称 作 VMI Linux 
(VMIL)。 当 VMI Linux 运行 在 硬件 上 的 时 候 , 它 链接 到 一 个 发 射 敏 感 指令 来 完成 工作 的 
函数 库 , 如 图 8-27(a) 所 示 。 当 它 运行 在 管理 程序 上 ,如 VMware 或 Xen, 客 户 操 作 系 统 链 
接 到 另 一 个 函数 库 , 该 函数 库 提供 对 低层 管理 程序 的 适当 (或 不 同 ) 例 程 调用 ,通过 这 种 方 
式 , 操 作 系 统 的 内 核 保持 了 可 移植 性 和 高 效 性 ,可 以 适应 不 同 的 管理 程序 。 
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8.3.2 内 存 的 虚拟 化 


前 面 几 节 介绍 了 处 理 器 虚拟 化 的 方法 。 但 是 一 个 计算 机 系统 不 止 有 处 理 器 ,还 有 内 存 
和 I/O 设备 ,也 需要 虚拟 化 。 

几乎 全 部 的 现代 操作 系统 都 支持 虚拟 内 存 , 即 从 虚拟 地 址 空间 到 物理 地 址 空间 的 页 面 
映射 。 这 个 映射 可 由 (多 级 ) 页 表 所 定义 。 通 过 操作 系统 设置 处 理 器 中 的 控制 寄存 器 ,使 之 
指向 顶级 页 表 , 从 而 动态 设置 页 面 映射 。 虚 拟 化 技术 使 得 内 存 管理 更 加 复杂 。 

例如 ,一 个 虚拟 机 正在 运行 ,其 中 的 客户 操作 系统 希望 将 它 的 虚拟 页 面 7、4、3 分 别 映射 
到 物理 页 面 10、11、12。 它 建立 包含 这 种 映射 关系 的 页 表 , 加 载 指 向 顶级 页 表 的 硬件 寄存 
器 。 这 条 指令 是 敏感 指令 。 在 支持 VT 技术 的 处 理 器 上 ,将 会 引起 陷入 ; 在 VMware 管理 
程序 上 , 它 将 会 调用 VMware 例 程 ; 在 准 虚拟 化 的 客户 操作 系统 中 , 它 将 会 调用 管理 程序 调 
用 。 简 单 地 讲 ,假设 它 陷 人 到 了 工 型 管理 程序 中 。 但 实际 上 ,在 上 述 3 种 情况 下 ,问题 都 是 
相同 的 。 

管理 程序 会 把 物理 页 面 10、11、12 分 配给 这 台 虚 拟 机 ,然后 建立 真实 的 页 表 使 之 分 别 映 
射 到 该 虚拟 机 的 虚拟 页 面 7、4、3, 随 后 使 用 这 些 页 面 。 

现在 ,假设 第 二 个 虚拟 机 启动 ,希望 把 它 的 虚拟 页 面 4、5、6 分 别 映射 到 物理 页 面 10、 
11、12, 并 加 载 指向 页 表 的 控制 寄存 器 。 管 理 程序 捕捉 到 这 次 陷入 时 ,不 能 进行 这 次 映射 , 因 
为 物理 页 面 10、11、12 正在 使 用 。 它 可 以 找到 其 他 空闲 页 面 ,如 20、21、22, 并 使 用 它们 ,但 
是 在 此 之 前 , 它 需 要 创建 一 个 新 的 页 表 完 成 虚拟 页 面 4、5、6 到 物理 页 面 20、21、22 的 映射 。 
如 果 还 有 其 他 的 虚拟 机 启动 ,继续 请 求 使 用 物理 页 面 10、11、12, 管 理 程序 也 必须 为 它 创建 
一 个 映射 。 总 之 ,管理 程序 必须 为 每 一 个 虚拟 机 创建 一 个 影子 页 表 (shadow page table) ,用 
以 实现 该 虚拟 机 使 用 的 虚拟 页 面 到 管理 程序 分 配给 它 的 物理 页 面 之 间 的 映射 。 

但 是 ,每 次 客户 操作 系统 改变 它 的 页 表 , 管 理 程序 必须 相应 地 改变 其 影子 页 表 。 例 如 ， 
如 果 客 户 操作 系统 将 虚拟 页 面 7 重新 映射 到 它 所 认为 的 “物理 页 面 "*200( 不 再 是 物理 页 面 
10 了 )。 管 理 程序 必须 了 解 这 种 改变 。 但 是 客户 操作 系统 只 需要 写 内 存 就 可 以 完成 这 种 改 
变 。 由 于 不 需要 执行 敏感 指令 ,管理 程序 根本 就 不 知道 这 种 改变 ,所 以 就 不 会 更 新 它 的 由 实 
际 硬件 使 用 的 影子 页 表 。 

解决 该 问题 的 方法 是 ,管理 程序 监视 客户 虚拟 内 存 中 保存 顶级 页 表 的 内 存 页 。 只 要 客 
户 操作 系统 试图 加 载 指向 该 内 存 页 的 硬件 寄存 器 ,管理 程序 就 能 获得 相应 的 信息 ,因为 这 条 
加 载 指令 是 敏感 指令 , 它 会 引发 陷入 。 这 时 ,管理 程序 建立 一 个 影子 页 表 , 把 项 级 页 表 和 顶 
级 页 表 所 指向 的 二 级 页 表 设 置 成 只 读 , 接 下 来 客户 操作 系统 只 要 试图 修改 它们 就 会 发 生 缺 
页 异常 。 然 后 把 控制 交 给 管理 程序 ,由 管理 程序 来 分 析 指 令 序列 ,了 解 客户 操作 系统 执行 的 
操作 ,并 据 此 更 新 影子 页 表 。 

VT 技术 可 以 通过 硬件 实现 两 级 映射 。 硬 件 首先 把 虚拟 页 表 映 射 成 客户 操作 系统 所 认 
为 的 “物理 页 面 ”, 然 后 再 把 它 ( 硬 件 仍 然 认为 它 是 虚拟 页 面 ) 映 射 到 物理 地 址 空间 ,这 样 做 不 
会 引起 陷入 。 通 过 这 种 方式 ,页 表 不 必 再 被 标记 成 只 读 , 而 管理 程序 只 需要 提供 从 客户 的 虚 
拟 空间 到 物理 空间 的 映射 。 当 虚拟 机 切换 时 ,管理 程序 改变 相应 的 映射 。 

在 准 虚拟 化 的 操作 系统 中 , 准 虚拟 化 的 客户 操作 系统 知道 当 它 结束 的 时 候 需 要 更 改进 
程 页 表 , 此 时 它 需 要 通知 管理 程序 。 所 以 , 它 首 先 彻 底 改 变 页 表 , 然 后 调用 管理 程序 例 程 来 
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通知 管理 程序 使 用 新 的 页 表 。 这 样 , 当 且 仅 当 全 部 的 内 容 被 更 新 的 时 候 , 才 会 进行 一 次 管理 
程序 例 程 调用 ,而 不 必 每 次 更 新 页 表 的 时 候 都 引发 一 次 保护 故障 ,这 样 效率 会 高 很 多 。 


8.3.3 MO 设备 的 虚拟 化 


客户 操作 系统 在 启动 的 时 候 ,会 探测 硬件 以 找 出 当前 系统 中 所 连接 的 I/O 设备 的 类 
型 。 这 些 探测 会 陷入 到 管理 程序 。 管 理 程序 的 一 种 做 法 是 向 客户 操作 系统 报告 设备 信息 ， 
如 磁盘 ,打印 机 等 真实 存在 的 硬件 。 于 是 客户 操作 系统 加 载 相应 的 设备 驱动 程序 以 使 用 这 
些 设备 。 当 设备 驱动 程序 试图 进行 O 操作 时 ,它们 会 读 写 设 备 的 硬件 寄存 器 。 这 些 指令 
是 敏感 指令 ,将 会 陷入 到 管理 程序 ,管理 程序 根据 需要 从 硬件 中 读 取 或 向 硬件 中 写 入 所 需 的 
数据 。 

男 一 种 处 理 I/O 操作 的 方法 是 让 其 中 一 个 虚拟 机 运行 标准 的 操作 系统 ,并 把 其 他 虚拟 
机 的 W/O 请 求全 部 反射 给 它 去 处 理 。 当 准 虚拟 化 技术 得 到 运用 之 后 ,这 种 方法 被 完善 了 ， 
发 送 到 管理 程序 的 命令 只 需 表 明 客 户 操作 系统 需要 什么 (如 从 磁盘 1 中 读 取 第 1403 块 ) ,而 
不 必 发 送 一 系列 写 磁盘 寄存 器 的 命令 ,在 这 种 情况 下 ,管理 程序 指出 客户 操作 系统 想 要 做 的 
事情 。Xen 使 用 这 种 方法 处 理 IO 操作 ,其 中 完成 IO 操作 的 虚拟 机 称 为 domain0 。 

在 IO 设备 虚拟 化 方面 ,于 型 管理 程序 相对 于 工 型 管理 程序 的 优势 在 于 : 宿主 操作 系 
统 包含 了 所 有 连接 到 计算 机 上 的 所 有 怪异 的 I/O 设备 的 驱动 程序 。 当 应 用 程序 试图 访问 
一 个 不 常见 的 I/O 设备 时 ,翻译 的 代码 可 以 调用 已 存在 的 驱动 程序 来 完成 相应 的 工作 。 但 
是 对 工 型 管理 程序 来 说 , 它 或 者 自身 包含 相应 的 驱动 程序 ,或 者 调用 domain0 中 的 驱动 程 
序 , 后 一 种 情况 与 宿主 操作 系统 很 相似 。 随 着 虚拟 技术 的 成 熟 , 将 来 的 硬件 也 许 会 让 应 用 程 
序 以 一 种 安全 的 方式 直接 访问 硬件 ,这 意味 着 驱动 程序 可 以 直接 链接 到 应 用 程序 代码 或 者 
作为 独立 的 用 户 空间 服务 ,从 而 解决 7O 虚拟 化 方面 的 问题 。 


8.3.4 虚拟 工具 


目前 ,很 多 应 用 程序 依赖 于 其 他 的 程序 或 函数 库 ,而 这 些 程序 和 函数 库 本 身 又 依赖 于 其 
他 的 软件 包 , 等 等 。 而 且 , 应 用 程序 对 特定 版 本 的 编译 器 、 脚 本 语言 或 操作 系统 也 可 能 有 依 
赖 关系 。 这 给 用 户 ( 特 别 是 使 用 开源 软件 的 用 户 ) 安 装 这 些 新 的 应 用 程序 造成 了 困难 。 采 用 
虚拟 机 技术 可 以 解决 上 述 问题 。 

使 用 虚拟 机 技术 ,软件 开发 人 员 能 够 创建 一 个 虚拟 机 , 装 入 所 需 的 操作 系统 ,编译 器 、 函 
数 库 和 应 用 程序 代码 ,组 成 一 个 整体 来 运行 。 该 虚拟 机 映像 可 以 被 放 到 光盘 (CD-ROM) 或 
网 站 上 供用 户 安装 或 下 载 。 这 种 方法 意味 着 只 有 软件 开发 者 需要 了 解 所 有 的 依赖 关系 。 客 
户 得 到 的 是 可 以 正常 工作 的 完整 的 程序 包 , 并 且 独 立 于 他 们 正在 使 用 的 操作 系统 、 各 类 软 
件 \ 已 安装 的 程序 包 和 函数 库 。 这 些 被 包装 好 的 虚拟 机 通常 叫做 虚拟 工具 (virtual 


appliance) 。 


8.3.5 多 核 处 理 机 上 的 虚拟 机 


当 虚 拟 机 与 多 核 技 术 相 结合 时 ,可 以 在 软件 中 指定 可 用 的 处 理 机 数量 。 例 如 ,如 果 有 4 
个 可 用 的 核 ,每 个 核 最 多 可 以 支持 8 个 虚拟 机 , 若 有 需要 ,一 个 单独 的 (桌面 ) 处 理 机 就 可 以 
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配置 成 32 节点 的 多 机 系统 ,但 是 根据 软件 的 需求 , 它 可 以 有 更 少 的 处 理 器 。 对 于 一 个 软件 
设计 者 来 说 ,在 编写 代码 之 前 可 以 先 选择 所 需 的 处 理 机 数量 。 

在 虚拟 机 之 间 是 可 以 实现 内 存 共享 的 ,需要 完成 的 工作 就 是 将 物理 页 面 映射 到 多 个 虚 
拟 机 的 地 址 空间 中 ,这样 ,一 台 计 算 机 就 成 为 一 个 虚拟 的 多 处 理 机 。 由 于 多 核 芯 片上 所 有 的 
核 共享 内 存 , 因 此 一 个 4 核 芯 片 能 够 很 容易 地 按照 需要 配置 成 32 节点 的 多 处 理 机 或 多 计算 
机 系统 。 

多 核 .虚拟 机 、 管 理 程序 和 微 内 核 的 结合 将 从 根本 上 改变 计算 机 的 系统 。 将 来 程序 员 要 
处 理 的 问题 是 ,确定 需要 的 处 理 机 数量 ,这 些 处理 机 是 应 该 组 成 一 个 多 计算 机 系统 还 是 一 个 
多 处 理 机 ,以 及 在 某 种 情况 下 需要 的 最 少 内 核 数 。 


8.3.6 授权 问题 


大 部 分 软件 是 基于 每 个 CPU 授权 的 。 换 言 之 , 当 购买 了 一 款 程序 时 ,有 权 在 一 个 CPU 
上 运行 该 程序 。 但 是 ,是 否 允 许 在 同一 台 物 理 机 上 的 多 个 虚拟 机 中 运行 该 软件 ? 在 某 种 程 
度 上 ,很 多 软件 商 是 不 知道 应 该 怎么 办 的 。 

如 果 某 些 公 司 获 得 授权 可 以 同时 在 台 物 理 机 上 运行 软件 ,那么 当 虚 拟 机 按照 需要 不 
断 产 生 和 消亡 的 时 候 , 问 题 就 会 变 得 更 糟糕 。 

在 某 些 情况 下 ,软件 商 在 许可 证 (license) 中 加 入 明确 的 条 款 ,禁止 在 虚拟 机 或 未 授权 的 
虚拟 机 中 使 用 该 软件 。 


习题 


1. 如 果 一 个 多 处 理 机 中 的 两 个 CPU 在 同一 时 刻 试图 访问 内 存 中 的 同一 个 字 , 会 发 生 
什么 事情 ? 

2. 如 果 一 个 CPU 在 每 条 指令 中 都 发 出 一 个 内 存 访问 请 求 , 而 且 计 算 机 的 运行 速度 是 
200MIPS ,那么 多 少 个 CPU 会 使 一 个 400MHz 的 总 线 饱 和 ? 假设 对 内 存 访问 需要 一 个 总 
线 周 期 。 如 果 在 该 系统 中 使 用 缓存 技术 , 且 缓 存 命 中 率 达到 90% ,那么 多 少 个 CPU 会 使 总 
线 饱 和 ? 最 后 ,如 果 要 使 32 个 CPU 共享 该 总 线 而 且 不 使 其 过 载 , 需 要 多 高 的 命中 率 ? 

3. 在 图 8-5 所 示 的 Omega 网 络 中 ,假设 在 交换 网 络 2A 和 交换 网 络 3B 之 间 的 连 线 断 
了 ,那么 哪些 节点 之 间 的 联系 被 切断 了 ? 

4. 在 多 处 理 机 同步 中 使 用 TSL 指令 时 ,如 果 持 有 锁 的 CPU 和 请 求 锁 的 CPU 都 需要 
使 用 这 个 拥有 互 斥 信号 量 的 高 速 缓存 行 ,那么 这 个 拥有 互 斥 信号 量 的 高 速 缓存 行 就 得 在 上 
述 两 个 CPU 之 间 来 回 穿梭 。 为 了 减少 总 线 的 交通 量 , 每 隔 50 个 总 线 周期 ,请 求 锁 的 CPU 
就 执行 一 条 TSL 指令 ,但 是 持 有 锁 的 CPU 在 两 条 TSL 指令 之 间 需 要 频繁 地 引用 该 拥有 互 
斥 信号 的 高 速 缓存 行 。 如 果 一 个 高 速 缓存 行 中 有 16 个 32 位 字 , 每 一 个 字 都 需要 用 一 个 总 
线 周期 传送 ,而 该 总 线 的 频率 是 400MHz, 那 么 高 速 缓存 行 的 来 回 移动 会 占用 多 少 总 线 
带宽 ? 

5. 对 于 图 8-16 中 的 每 个 拓扑 结构 ,互联 网 络 的 直径 是 多 少 ? 请 计算 该 问题 的 所 有 跳 
数 ( 主 机 -路 由 器 和 路 由 器 -路 由 器 ) 。 
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6. 考虑 图 8-16(d) 中 的 双 凸 面 拓扑 结构 ,但 是 扩展 到 Xk 网 格 。 该 网 络 的 直径 是 多 
少 ? 提示 : 分 别 考虑 & 是 奇数 和 偶数 的 情况 。 

7. 在 共享 存储 器 多 处 理 机 和 多 计算 机 上 Send 和 Receive 的 实现 有 哪些 差别 ? 这 些 差 
别 对 性 能 有 何 影 响 ? 

8. 考虑 图 8-24 中 的 CPU 分 配 。 假 设 进程 H 从 节点 2 被 移 到 节点 3 上 ,此 时 的 外 部 信 
息 流量 是 多 少 ? 

9. 考虑 能 同时 支持 最 多 nn 个 虚拟 机 的 工 型 管理 程序 ,PC 最 多 可 以 有 4 个 主 磁盘 分 区 。 
请 问 交 可 以 比 4 大 吗 ? 如 果 可 以 ,数据 可 以 存在 哪里 ? 

10. 处 理 客户 操作 系统 使 用 普通 (非特 权 ) 指 令 改 变 页 表 的 一 个 方式 是 将 页 表 标 记 为 只 
读 ,所 以 当 它 被 修改 的 时 候 系统 陷入 。 还 有 什么 方式 可 以 维护 页 表 副 本 ? 比较 你 的 方法 与 
只 读 页 表 在 效率 上 的 差别 。 
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嵌入 式 操 作 系统 是 运行 在 嵌入 式 平台 上 的 ,可 以 为 内 入 式 应 用 软件 提供 接口 ,对 嵌入 式 
处 理 器 和 艇 入 式 外 围 设备 等 硬件 资源 进行 管理 的 系统 软件 。 本 章 围绕 嵌入 式 操作 系统 的 发 
展 历程 .特点 、 功 能、 应 用 领域 和 发 展 趋势 进行 了 介绍 ,同时 还 介绍 了 一 些 典 型 嵌入 式 操 作 系 
统 的 实例 。 


6.i 什么 是 嵌入 式 操作 系统 


20 世纪 末 , 随 着 信息 技术 与 网 络 技术 的 迅猛 发 展 ,计算 机 技术 已 经 进入 后 PC (Post- 
PC) 时 代 。 该 时 代 的 计算 机 更 加 多 样 化 ,它们 遍布 在 人 们 周围 ,功能 强大 ,向 人 们 提供 各 种 
便捷 的 服务 ,而 人 们 似乎 又 感觉 不 到 它们 的 存在 ,这 就 是 无 处 不 在 的 计算 (pervasive 
computing 或 ubiquitous computing ,也 称 为 泛 在 计算 )。 无 处 不 在 的 计算 模式 依赖 于 通用 
计算 机 和 能 入 式 计算 机 ,通用 计算 机 只 占 大 约 5% 的 比例 ,而 嵌入 式 计算 机 占 大 约 95% 的 
比例 。 

嵌入 式 计算 机 通常 被 称 为 嵌入 式 系统 (embedded system)。 赃 入 式 系统 是 以 应 用 为 中 
心 ,以 计算 机 技术 为 基础 , 软 硬 件 可 配置 ,对 功能 、 可 靠 性 成 本 、 体 积 、 功 耗 有 严格 约束 的 专 
用 计算 机 系统 。 纵 观 嵌 入 式 系统 的 发 展 过 程 ,其 出 现 至 今 已 经 有 50 多 年 的 历史 ,大 致 经 历 
了 以 下 五 个 阶段 。 

第 一 阶段 大 致 在 20 世纪 60 年 代 后 期 ,可 看 作 嵌 入 式 系 统 的 萌芽 阶段 。 这 一 阶段 的 幅 
入 式 系统 是 以 单 芯 片 为 核心 的 可 编程 控制 器 形式 的 系统 ,具有 与 监测 ,伺服 、 指 示 设 备 相 配 
合 的 功能 。 这 类 系统 大 部 分 应 用 于 一 些 专 业 性 较 强 的 工业 控制 系统 中 ,一 般 没 有 操作 系统 
的 支持 ,通过 汇编 语言 编程 对 系统 进行 直接 控制 。 这 一 阶段 系统 的 主要 特点 是 : 系统 结构 
和 功能 相对 单一 ,处 理 效率 较 低 ,存储 容量 较 小 ,只 有 很 少 的 用 户 接口 。 由 于 这 种 嵌入 式 系 
统 使 用 简单 ,价格 低廉 ,即使 现在 依然 在 简单 、 低 成 本 的 伐 入 式 应 用 领域 大 量 使 用 ,但 已 经 远 
不 能 适应 高 效 、 需 要 大 容量 存储 的 现代 工业 控制 和 新 兴 信 息 家 电 等 领域 的 需求 。 

第 二 阶段 为 第 一 阶段 之 后 的 十 多 年 。 这 一 阶段 的 嵌入 式 系统 以 嵌入 式 处 理 器 为 基础 ， 
以 简单 操作 系统 为 核心 。 在 此 阶段 ,大 多 数 嵌 入 式 系统 使 用 8 位 处 理 器 ,不 需要 嵌入 式 操作 
系统 的 支持 。 其 主要 特点 是 : 处 理 器 种 类 繁多 ,通用 性 较 弱 ; 系统 开销 小 ,效率 高 ; 高 端 应 
用 所 需 操 作 系 统 已 具备 一 定 的 实时 性 、 兼 容 性 和 可 扩展 性 ; 应 用 软件 较 专业 化 ,用 户 界面 不 
够 友好 。 
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第 三 阶段 大 致 是 20 世纪 80 年 代 末 到 20 世纪 90 年 代 后 期 ,是 嵌入 式 应 用 开始 普及 的 
阶段 。 这 一 阶段 的 嵌入 式 系统 以 嵌入 式 操 作 系统 为 标志 。 其 主要 特点 是 :嵌入 式 操作 系统 
内 核 小 ,效率 高 ,具有 高 度 的 模块 化 和 可 扩展 性 ,能 运行 于 各 种 不 同类 型 的 微 处 理 器 上 ,兼容 
性 好 ; 具备 文件 和 目录 管理 ,多 任务 、 网 络 支持 、 图 形 窗口 以 及 用 户 界面 等 功能 ,提供 大 量 的 
应 用 程序 接口 (API) 和 集成 开发 环境 ,简化 了 应 用 程序 开发 ; 嵌入 式 应 用 软件 丰富 。 在 此 
阶段 ,让 入 式 系统 的 软 硬 件 技术 加 速 发 展 ,应 用 领域 不 断 扩大 。 例 如 ,日 常生 活 中 使 用 的 手 
机 数码 相机 以 及 网 络 设备 中 的 路 由 器 交换 机 等 都 是 租 入 式 系 统 ; 一 辆 豪华 汽车 中 有 数 十 
个 嵌入 式 处 理 器 ,分 别 控制 发 动机 、 传 动 装置 .安全 装置 等 ; 一 个 飞行 器 上 可 以 有 数 百 个 其 
至 上 千 个 嵌入 式微 处 理 器 。 

第 四 阶段 从 20 世纪 90 年 代 末 开始 ,这 一 阶段 的 嵌入 式 系统 以 网 络 化 和 因特网 为 标志 。 
随 着 因特网 的 发 展 以 及 因特网 技术 与 信息 家 电 、 工 业 控 制 . 航 空 航 天 等 技术 的 结合 日 益 紧 
密 , 骨 人 和 人 式 设备 与 因特网 的 结合 代表 了 工人 入 式 系统 的 未 来 。1998 年 11 月 在 美国 加 利 福 尼 
亚 州 圣 。 何 塞 举 行 的 供 入 式 系 统 大 会 上 ,基于 嵌入 式 实 时 操作 系统 的 因特网 成 为 一 个 新 的 
技术 热点 。 

第 五 个 阶段 是 从 21 世纪 初 到 现在 ,这 一 阶段 的 能 入 式 系统 以 物 联网 ` 云 计算 和 智能 化 
为 标志 ,也 是 多 核 芯 片 技术 无 线 技术 .互联 网 发 展 与 信息 家 电 、 工 业 控制 .航空 航天 等 技术 
相 结合 的 必然 结果 。 从 应 用 角度 而 言 ,移动 互联 网 设备 是 嵌入 式 产品 的 热点 。 目 前 ,具备 网 
络 互联 功能 的 智能 终端 年 出 货 量 已 达到 4 亿 部 , 比 同 时 期 笔记 本 式 计 算 机 和 人 台式 计算 机 出 
货 量 的 总 和 还 要 多 。 无 处 不 在 的 舱 入 式 系统 ,如 智能 手机 、 无 线 传感器 网 络 (Wireless 
Sensor Network，WSN) .RFID 电子 标签 等 遍布 在 人 们 周围 ,为 人 们 提供 方便 快捷 的 服务 。 

由 此 可 见 , 嵌 入 式 操作 系统 是 随 着 嵌入 式 计 算 机 的 发 展 而 发 展 的。 嵌入 式 系统 软件 的 
日 益 复 杂 ,在 客观 上 使 得 软件 的 编写 需要 多 人 分 工 合作 完成 。 从 内 入 式 软件 体系 结构 的 角 
度 考虑 ,就 是 将 一 个 软件 功能 划分 成 多 个 任务 ,采用 实时 多 任务 体系 实现 。 因 此 ,功能 强大 
的 嵌入 式 操作 系统 成 为 支撑 其 运行 的 基础 。 由 于 骨 入 式 操作 系统 及 其 应 用 软件 往往 被 坐 入 
特定 的 控制 设备 或 者 仪器 中 ,用 于 实时 响应 并 处 理 外 部 事件 ,所 以 嵌入 式 操作 系统 有 时 也 被 
称 为 实时 操作 系统 (Real-Time Operating System，RTOS) 。 

RTOS 可 以 简单 地 认为 是 功能 强大 的 主 控 程 序 , 它 嵌入 在 目标 代码 中 ,系统 复位 后 首先 
执行 。 负 责 在 硬件 基础 上 为 应 用 软件 建立 一 个 功能 强大 的 运行 环境 ,用 户 的 应 用 程序 都 建 
立 在 RTOS 之 上 。 在 这 个 意义 上 ,RTOS 的 作用 是 为 用 户 提 供 一 台 等 价 的 扩展 计算 机 , 它 
比 底层 硬件 更 容易 编程 操作 。 

RTOS 内 含 一 个 实时 内 核 ,完成 最 基本 却 又 必 不 可 少 的 功能 ,如 CPU、 中 断 \ 时 钟 ,1/O 
等 资源 的 管理 ,为 用 户 提供 一 套 标 准 编程 接口 ,并 可 根据 各 个 任务 的 优先 级 ,合理 地 在 不 同 
任务 间 分 配 CPU 资源 。 在 此 意义 上 ,RTOS 的 作用 相当 于 系统 资源 管理 器 。 

对 嵌入 式 系统 而 言 ,RTOS 的 引入 会 带 来 很 多 好 处 。 首 先 ,一 个 RTOS 就 是 一 套 标准 
化 的 任务 管理 机 制 , 可 以 提升 开发 单位 的 管理 水 平和 开发 人 员 的 业务 素质 ; 其 次 ,每 个 
RTOS 都 提供 一 套 较 完整 的 应 用 编程 接口 ,可 以 大 大 简化 应 用 编程 ,提高 系统 的 可 靠 性 ; 再 
次 ,RTOS 的 引入 客观 上 导致 应 用 软件 与 下 层 硬 件 环 境 无 关 , 便 于 嵌入 式 软件 系统 的 移植 ; 
最 后 ,基于 RTOS 可 以 直接 使 用 许多 应 用 编程 中 间 件 , 既 可 增强 嵌入 式 软件 的 复 用 能 力 ,又 
可 降低 开发 成 本 ,缩短 开发 周期 。 
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6.2 嵌入 式 操作 系统 的 特点 


相对 于 通用 操作 系统 (如 Windows、PC 版 Linux 等 ) 而 言 ,RTOS 往往 具有 以 下 共同 


1. 实时 性 


实时 性 (timeliness) 是 嵌入 式 实时 系统 最 基本 的 特点 ,也 是 RTOS 必须 保证 的 特性 。 
RTOS 的 主要 任务 是 对 外 部 事件 做 出 实时 响应 。 虽 然 事件 可 能 在 无 法 预知 的 时 刻 到 达 ,但 
是 软件 必须 在 事件 发 生 时 能 够 在 严格 的 时 限 ( 称 为 系统 响应 时 间 ,response time) 内 做 出 响 
应 ,即使 在 峰值 负载 下 也 应 如 此 。 系 统 响 应 时 间 超时 可 能 就 意味 着 致命 的 失败 。 

由 于 不 同 的 实时 系统 对 实时 性 的 要 求 有 所 不 同 , 实 时 性 可 以 分 为 以 下 两 类 。 

(1) 硬 实时 (hard real-time)。 系 统 对 外 部 事件 的 响应 略 有 延迟 就 会 造成 灾难 性 的 后 
果 , 也 就 是 说 ,系统 响应 时 间 必 须 严格 小 于 规定 的 截止 时 间 (deadline) 。 

(2) 软 实时 (soft real-time)。 系 统 对 外 部 事件 响应 超时 可 能 会 导致 系统 产生 一 些 错误 ， 
但 不 会 造成 灾难 性 后 果 , 且 大 多 数 情况 下 不 会 影响 系统 的 正常 工作 。 

对 于 RTOS 而 言 , 实 时 性 主要 由 实时 多 任务 内 核 的 任务 调度 机 制 和 调度 策略 共同 确 
保 。 不 同 的 RTOS 所 提供 的 策略 有 所 不 同 , 有 些 支持 硬 实时 性 ,有 些 只 支持 软 实时 性 ,但 主 
流 RTOS 需要 支持 多 种 实时 性 。 


2. 可 确定 性 


RTOS 的 一 个 重要 特点 是 具有 可 确定 性 (deterministic), 即 系统 在 运行 过 程 中 ,系统 调 
用 的 时 间 可 以 预测 。 虽 然 系 统 调 用 的 执行 时 间 不 是 一 个 固定 值 ,但 是 其 最 大 执行 时 间 可 以 
确定 ,从 而 能 对 系统 运行 的 最 好 情况 和 最 坏 情况 做 出 精确 的 估计 。 

衡量 操作 系统 可 确定 性 的 一 个 重要 指标 是 截止 时 间 , 它 规定 系统 对 外 部 事件 的 响应 必 
须 在 给 定时 间 内 完成 。 截 止 时 间 的 长 短 随 应 用 的 不 同 而 不 同 ,可 以 从 纳 秒 (ns) 级 、 微 秒 (ps) 
级 直到 分 钟 (min) 级 小 时 (h) 级 、 天 (d) 级 。 

在 实时 系统 中 ,外 部 事件 随机 到 达 。 但 在 规定 的 时 序 范围 内 ,有 多 少 外 部 事件 可 以 到 达 
却 必须 是 可 预测 (可 控 ) 的 。 这 是 RTOS 可 确定 性 的 第 二 种 体现 。 

可 确定 性 的 第 三 种 体现 是 对 系统 资源 占用 的 确定 化 。 对 大 多 数 嵌 入 式 系统 ,特别 是 硬 
实时 系统 而 言 ,在 系统 开始 运行 前 ,每 个 任务 需要 哪些 资源 , 哪 种 情况 下 ( 何 时 ) 占 用 资源 都 
应 是 可 预测 的 。 在 极端 情况 下 ,资源 占用 必须 用 静态 资源 分 配 表 一 一 列 出 。 


3. 并 发 性 


并 发 性 (concurrence) 有 时 也 称 为 同时 性 (simultaneousness)。 在 复杂 的 实时 系统 中 ,外 
部 事件 的 到 达 是 随机 的 ,因此 某 一 时 刻 可 能 有 多 个 外 部 事件 到 达 ,RTOS 需要 同时 激活 多 个 
任务 (task) 处 理 对 应 的 外 部 请 求 。 通 常 ,实时 系统 采用 多 任务 机 制 或 者 多 处 理 机 结构 来 解 
决 并 发 性 问题 ,而 RTOS 则 用 于 相应 的 管理 。 
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4. 高 可 信 性 


不 管 外 部 条 件 如 何 恶 劣 ,实时 系统 都 必须 能 够 在 任意 时 刻 、 任 意 地 方 、 任 意 环境 下 对 外 
部 事件 做 出 准确 响应 。 这 就 要 求 RTOS 比 通用 操作 系统 更 具 可 靠 性 (reliability)、 稳 健 性 
(robustness) 和 防 危 性 (safety) 。 这 些 特性 统称 为 高 可 信 性 Chigh dependability) 。 

可 靠 性 是 指 在 一 组 特定 条 件 下 ,系统 在 一 定时 期 内 不 发 生 故 障 的 概率 。 它 强调 的 是 系 
统 连续 工作 的 能 力 ,是 一 个 通信 系统 的 必要 指标 。 

稳健 性 特别 强调 容错 处 理 和 出 错 自动 恢复 ,确保 系统 不 会 因为 软件 错误 而 崩溃 甚至 出 
现 灾难 性 后 果 。 即 使 在 最 坏 情 况 下 ,RTOS 也 应 能 够 让 系统 性 能 平稳 降级 ,最 好 能 自动 恢复 
正常 运行 状态 。 

防 危 性 研究 系统 是 否 会 导致 灾难 发 生 , 关 心 的 是 引起 危险 的 软件 故障 。 在 实际 应 用 中 ， 
它 主要 确保 系统 对 外 部 设备 的 操作 不 出 现 异 常 ,这 一 点 在 安全 关键 系统 (如 核电 控制 系统 、 
航空 航天 系统 ) 中 尤为 突出 。 

5. 安全 性 

信息 安全 (security) 是 目前 因特网 上 最 热门 的 话题 之 一 ,其 中 很 大 一 部 分 原因 归结 于 基 
础 网 络 设 备 (路 由 器 .交换 机 等 ) 的 安全 管理 机 制 ,其 核心 是 保密 。 

RTOS 自然 需要 从 系统 软件 级 就 为 能 入 式 设备 提供 安全 保障 措施 ,关注 外 部 环境 对 系 
统 的 恶意 攻击 ,减少 应 用 开发 者 的 重复 劳动 。 





6. 可 嵌入 性 


RTOS 及 其 应 用 软件 基本 上 都 需要 典 入 具体 设备 或 者 仪器 中 ,因此 ,RTOS 必须 具有 足 
够 小 的 体积 及 很 好 的 可 裁剪 性 和 灵活 性 。 这 就 是 可 嵌入 性 (embeddability) 的 含义 。 

由 于 大 多 数 嵌入 式 设备 的 资源 有 限 , 不 大 可 能 像 个 人 计算 机 一 样 预 装 操 作 系 统 、 设 备 驱 
动 程序 等 。 因 此 ,最 常见 的 RTOS 应 用 原则 是 : 将 RTOS 与 上 层 应 用 软件 捆绑 成 一 个 完整 
的 可 执行 程序 ,下 载 到 目标 系统 中 ; 当 目标 系统 启动 时 ,首先 引导 RTOS 执行 ,再 控制 管理 
其 他 应 用 软件 模块 。 


7. 可 剪裁 性 


嵌入 式 系统 对 资源 有 严格 限制 .RTOS 就 不 可 能 如 桌面 操作 系统 (Windows 等 ) 一 样 装 
载 大 量 的 功能 模块 ,而 必须 对 应 用 有 极 强 的 针对 性 。 因 此 ,RTOS 必须 具有 可 剪裁 性 
(tailorability) , 即 组 成 RTOS 的 各 模块 (组 件 ) 能 根据 不 同 应 用 的 要 求 合 理 剪 裁 , 做 到 够 用 
即 可 。 


8. 可 扩展 牲 


当前 , 柑 入 式 应 用 的 发 展 异常 迅猛 .新 型 嵌入 式 设 备 的 功能 多 种 多 样 ,这 对 RTOS 提出 
了 可 扩展 性 (extensibility) 的 要 求 。 即 除 提供 基本 的 内 核 支持 外 ,还 须 提 供 越 来 越 多 的 可 扩 
展 功能 模块 ( 含 用 户 扩 展 ) ,如 功 耗 控 制 动态 加 载 `. 嵌 入 式 文件 系统 .嵌入 式 图 形 用 户 界面 
(Graphic User Interface,GUJT) 系 统 、 租 入 式 数 据 库 系 统 等 。 
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6.3 嵌入 式 操作 系统 的 主要 功能 


RTOS 的 基本 功能 由 内 核 完成 ,主要 负责 任务 管理 ,中 断 管理 ,时 钟 管理 ,任务 协调 ( 通 
信 、 同 步 ,资源 互 斥 访问 等 )\ 内 存 管理 等 ,这 些 管 理 功能 是 通过 内 核 系统 调用 的 形式 供用 户 
使 用 的 ; 其 他 功能 以 RTOS 扩展 组 件 形式 实现 ,包括 嵌入 式 网 络 、 租 入 式 文件 系统 , 功 耗 管 
理 、. 嵌 入 式 数据 库 、 流 媒体 支持 .用 户 编程 接口 .嵌入 式 GUI 等 。 


1. 任务 管理 


多 任务 机 制 是 现代 操作 系统 的 基础 。 一 个 多 任务 的 环境 允许 将 实时 应 用 构造 成 一 套 独 
立 的 任务 集合 ,每 个 任务 拥有 各 自 的 执行 进程 和 系统 资源 ,这 些 任 务 共同 合作 以 实现 整个 系 
统 的 功能 。 

多 任务 并 发 执行 造成 了 一 种 多 个 任务 同时 执行 的 假象 。 事实 上 ,内 核 是 将 某 种 调度 算 
法 加 入 这 些 任务 的 执行 中 ,使 每 个 任务 拥有 自己 的 上 下 文 ,包括 CPU 执行 环境 和 系统 资 
源 。 这 种 内 核 调度 机 制 是 任务 运行 时 所 必需 的 ,类 似 于 通用 多 任务 操作 系统 (如 UNIX、 
Windows) 中 的 处 理 , 只 是 增加 了 实时 性 的 要 求 。 


2. 中 断 管理 


中 断 (interrupt) 是 外 部 事件 通知 RTOS 的 主要 机 制 。 外 部 事件 产生 的 中 断 属于 硬件 机 
制 , 它 向 CPU 发 出 中 断 信号 ,表示 外 部 异步 事件 发 生 。 异 步 事件 是 指 无 一 定时 序 关系 的 随 
机 事件 ,如 外 部 设备 完成 数据 传输 ,实时 控制 设备 出 现 异常 情况 等 。 

应 用 任务 是 由 RTOS 调度 的 ,而 中 断 处 理 程序 一 定 是 异步 执行 的 ,不 需要 RTOS 调度 。 
当中 断 被 触发 时 ,中 断 处 理 程序 就 开始 运行 。 实 时 系统 必须 能 够 快速 响应 外 部 产生 的 中 断 ， 
以 成 功 地 与 外 部 环境 进行 交互 。 实 时 多 任务 系统 有 如 下 3 种 方式 来 处 理 外 部 的 中 断 请 求 : 

(1) 中 断 作为 任务 切换 。 

(2) 中 断 作为 系统 调用 。 

(3) 中 断 作 为 前 台 事务 。 


3. 时 钟 管理 


在 实时 系统 中 ,实时 时 钟 (clock) 是 实时 软件 运行 必 不 可 少 的 硬件 设施 。 实 时 时 钟 单纯 
地 提供 一 个 规则 的 脉冲 序列 ,脉冲 之 间 的 间隔 可 以 作为 系统 的 时 间 基 准 , 称 为 时 基 (tick ) 。 
时 基 的 大 小 代表 了 实时 时 钟 的 精度 ,这 个 精度 取决 于 系统 的 要 求 。 

为 了 计 准 时 间 间 隔 , 最 重要 的 问题 是 确保 CPU 能 与 时 钟 同步 工作 。 同 步 可 以 用 硬件 
方法 实现 ,也 可 以 用 软件 方法 实现 。 软 件 方法 是 使 CPU 能 用 程序 启动 .停止 时 钟 工作 , 设 
午时 基 大 小 ,并 在 启动 后 利用 实时 时 钟 中 断 信号 的 方法 来 校准 系统 时 钟 。 时 基 的 每 次 到 达 
都 会 引发 时 钟 中 断 ,中 断 响应 后 ,实时 时 钟 又 开始 工作 ,从 而 达到 与 CPU 同步 的 目的 。 

显然 ,软件 方法 具有 简单 .灵活 、 易 实现 和 低 成 本 的 优点 ,可 以 很 方便 地 修改 实时 时 钟 的 
设置 和 系统 时 间 的 表示 , 且 可 以 在 不 增加 硬件 的 基础 上 灵活 地 用 软件 模拟 多 个 “ 软 时 钟 ”。 
因此 ,这 种 方法 在 实时 系统 中 被 广泛 采用 。 
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由 于 中 断 的 延迟 可 能 会 对 系统 时 钟 造成 一 定 的 误差 。 因 此 ,在 设计 中 通常 将 实时 时 钟 
的 中 断 优先 级 设置 得 很 高 ,一 般 仅 次 于 掉 电 中 断 。 

系统 的 时 间 精 度 要 求 越 高 ,时 钟 中 断 的 频 度 就 越 高 ,执行 中 断 服务 程序 (ISR) 的 时 间 就 
会 增多 ,系统 开销 相应 增 大 ,导致 影响 系统 的 其 他 工作 。 为 解决 这 个 矛盾 ,必须 在 充分 考虑 
时 间 精 度 的 前 提 下 ,使 时 钟 ISR 程序 尽 可 能 简短 。 

由 于 嵌入 式 实 时 系统 硬件 设备 的 多 样 化 ,实时 内 核 提 供 的 系统 时 钟 服务 也 需要 适应 这 
种 种 灵活 性 的 要 求 。 在 RTOS 中 ,系统 时 钟 服务 通常 并 不 是 以 中 断 服务 程序 的 形式 出 现 ， 
而 只 是 提供 应 用 所 需 的 中 断 服务 程序 系统 调用 。 通 过 使 用 这 些 系统 调用 ,系统 的 时 间 精 度 
可 以 完全 由 应 用 决定 ,其 大 小 由 调用 时 基 的 时 间 间 隔 决定 。 时 基 完 成 系统 计时 唤醒 睡眠 时 
间 和 等 待 时 间 到 达 的 任务 .时 间 片 循环 调度 等 工作 。 


4. 任务 协调 


对 于 外 界 提 出 的 多 种 请 求 ,RTOS 需要 创建 多 个 任务 进行 处 理 , 任 务 之 间 往 往 有 一 定 的 
执行 顺序 或 者 资源 使 用 上 的 约束 ,这 就 要 求 任务 在 执行 过 程 中 必须 能 够 互通 消息 ,相互 合 
作 ,协同 完成 外 部 的 事务 请 求 。 根 据 任务 之 问 协调 目的 的 不 同 , 任 务 协 调 可 分 为 通信 、 同 步 、 
资源 互 斥 访问 几 大 类 。 


5. 内 存 管 理 


嵌入 式 系统 软件 是 操作 系统 与 应 用 软件 一 体 化 的 软件 ,其 内 存 管理 (memory 
management) 比较 简单 。 任 务 在 运行 过 程 中 对 内 存 的 需求 是 不 断 变化 的 ,不 同 的 任务 有 不 
同 的 需要 。RTOS 将 内 存 作为 一 种 资源 看 待 .并 且 在 竞争 的 任务 之 间 分 配 这 种 资源 ,就 如 同 
在 竞争 的 任务 间 分 配 CPU 控制 权 一 样 。 

RTOS 内 核 通 常 使 用 3 种 方法 进行 内 存 分 配 ; 固定 尺寸 静态 分 配 、 可 变 尺 寸 动态 分 配 、 
数据 段 分 块 管理 。 


6. 嵌入 式 网 络 


在 后 PC 时 代 和 互联 网 普及 的 今天 ,几乎 所 有 的 嵌入 式 系统 (如 移动 终端 智能 家 电 等 ) 
以 及 面向 特定 领域 的 戏 和 人 式 设备 都 提出 了 互联 需求 。 目 前 ,嵌入 式 系统 接 人 网 络 的 方案 主 
要 有 3 种 : 第 一 种 方案 是 采用 硬件 集成 有 网 络 协议 栈 功能 的 物理 芯片 来 实现 网 络 通信 ; 第 
二 种 方案 是 采用 嵌入 式微 网 络 技术 实现 互联 ; 第 三 种 方案 是 在 嵌入 式 实时 操作 系统 的 平台 
上 集成 嵌入 式 TCP/IP 网 络 协议 栈 \` 面 向 物 联 网 的 协议 栈 、 特 定 领域 的 网 络 协议 栈 ,以 实现 
互联 和 互通 。 

目前 公认 的 嵌入 式 网 络 系统 包括 工业 现场 总 线 、. 嵌 入 式 TCP/IP、 嵌 入 式 无 线 网 络 ( 红 
外 线 、 蓝 牙 .WAP、IEEE 802. 11 等 ) .传感器 网 络 等 多 种 形式 。 


7. 矢 入 式 文 件 系统 


在 通用 操作 系统 中 ,文件 系统 是 操作 系统 必须 具有 的 一 部 分 。 但 在 嵌入 式 应 用 中 ,很 多 
情况 下 不 需要 文件 系统 (如 家 电 控 制 系统 )。 即 使 需要 文件 系统 ,多 数 情 况 下 也 只 是 通用 操 
作 系统 所 拥有 的 文件 系统 的 一 个 子 集 。 因 此 ,嵌入 式 文件 系统 是 一 个 可 配置 的 模块 。 
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车 提供 文件 系统 ,就 必须 提供 创建 文件 ,删除 文件 、 读 文件 和 写 文件 等 基本 功能 的 系统 
调用 。 文 件 的 存放 同样 通过 目录 完成 ,对 目录 的 操作 是 文件 系统 功能 的 一 部 分 。 从 系统 的 
角度 出 发 ,文件 系统 应 具有 以 下 功能 : 

(1) 提供 对 文件 和 目录 的 分 层 组 织 形式 。 

(2) 建立 与 删除 文件 。 

(3) 文件 的 动态 增长 与 数据 保护 。 

从 用 户 的 角度 来 看 ,文件 系统 的 功能 可 简单 地 描述 为 实现 文件 的 按 名 存 取 。 当 第 一 次 
使 用 系统 调用 open 或 者 create 存 取 一 个 特定 文件 时 ,用 户 将 文件 名 作为 参数 ,文件 系统 在 
进行 必要 的 检查 之 后 返回 一 个 称 为 文件 描述 符 的 整数 ,此 后 对 文件 的 I/O 操作 都 要 用 到 该 
文件 描述 符 。 





8. 功 耗 管理 


随 着 后 PC 时 代 的 到 来 ,嵌入 式 系统 变 得 小 巧 玲珑 而 且 功能 强大 ,一 块 小 小 的 芯片 就 可 
以 实现 无 线 通信 、 图 像 处 理 、 多 媒体 播放 等 功能 。 对 于 使 用 容量 有 限 的 电池 的 嵌入 式 系统 ， 
一 方面 ,人 们 希望 系统 具有 越 来 越 多 的 功能 .例如 手机 的 摄影 ,摄像 等 ; 而 男 一 方面 ,人 们 又 
不 希望 频繁 地 充电 或 更 换 电池 ,也 不 希望 随身 携带 大 体积 的 电池 。 从 原理 上 讲 , 这 种 需要 可 
以 通过 不 断 提高 电池 的 单位 体积 容量 来 实现 。 然 而 不 幸 的 是 ,在 过 去 的 30 年 中 ,电池 单位 
体积 的 容量 只 提高 了 不 到 4 倍 , 远 远 滞后 于 处 理 器 技术 的 发 展 速度 ,并 以 每 年 20% 一 30% 
的 速度 进一步 拉 大 与 处 理 器 技术 的 差距 。 因 此 ,降低 功 耗 成 为 必然 趋势 。 

电源 容量 没有 限制 的 嵌入 式 系统 同样 存在 功 耗 问题 ,其 基本 体现 形式 就 是 散热 问题 。 
芯片 的 集成 度 从 20 世纪 80 年 代 的 800nm 发 展 到 21 世纪 初 的 130nm, 目 前 已 达到 10nm 其 
至 更 低 。 这 种 进步 带 来 的 副作用 就 是 散热 问题 越 来 越 突 出 。 这 是 因为 ,一 旦 芯片 的 功 耗 大 
于 50W ,就 需要 添加 辅助 散热 装置 ,以 避免 电子 器 件 和 芯片 失效 。 相 应 地 ,降低 芯片 的 功 耗 
能 够 避免 关键 器 件 大 量 散 热 , 对 降低 设备 维护 成 本 、 延 长 设备 寿命 具有 重要 作用 。 


9. 嵌入 式 数据 库 


相 入 式 数 据 库 系统 是 指 支持 移动 计算 或 某 种 特定 计算 模式 的 数据 库 管理 系统 , 它 通常 
与 操作 系统 和 具体 的 应 用 集成 在 一 起 ,运行 在 嵌入 式 或 移动 设备 中 。 艇 入 式 数 据 库 技术 涉 
及 数据 库 、 实 时 系统 、 分 布 式 计算 以 及 移动 通信 等 多 个 领域 ,已 成 为 数据 库 技 术 发 展 的 一 个 
新 方向 。 

与 通用 的 桌面 操作 系统 不 同 ,嵌入 式 系统 通常 没有 充足 的 内 存 和 磁盘 资源 。 因 此 ,嵌入 
式 操 作 系统 和 数据 库 系统 都 应 占用 尽量 少 的 内 存 和 磁盘 空间 。 如 果 采 用 传统 的 文件 系统 或 
大 型 关系 型 数据 库 管 理 系统 ,将 不 可 避免 地 出 现 完 余数 据 大 量 产生 .数据 管理 效率 低下 等 问 
题 ,不 能 很 好 地 适应 嵌入 式 系统 的 数据 管理 需要 。 另 外 ,大 型 数据 库 系 统 大 都 致力 于 高 性 能 
的 事务 处 理 能 力 以 及 复杂 的 查询 处 理 能 力 ,而 对 于 嵌入 式 数据 库 系 统 来 说 ,一 般 只 要 求 进行 
一 些 简单 的 数据 查询 和 更 新 操作 ,其 性 能 的 度量 标准 主要 在 易于 维护 强壮、 小巧 这 3 个 方 
面 。 在 高 端 谋 入 式 应 用 中 ,系统 的 配置 和 快速 运行 一 般 基于 RTOS。 如 果 在 RTOS 之 上 使 
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用 数据 库 管理 系统 ,那么 数据 库 管理 系统 必须 同样 具备 良好 的 实时 性 能 ,以 确保 与 操作 系统 
结合 后 不 会 影响 整个 系统 的 实时 性 能 。 

随 着 计算 终端 的 小 型 化 ,嵌入 式 数据 库 的 应 用 领域 不 断 扩展 ,可 以 预见 ,在 不 久 的 将 来 ， 
嵌入 式 数 据 库 的 应 用 将 无 所 不 在 ,其 领域 主要 涉及 移动 互联 网 、 移 动 电子 商务 /政务 、 移 动物 
流 、 移 动 金 融 系统 、 移 动 新 闻 等 。 


10. 流 媒体 支持 


流 媒体 技术 起 源 于 窄带 互联 网 时 期 。 由 于 经 济 发 展 的 需要 ,人 们 渴求 一 种 网 络 技术 ,以 
便 进 行 远 程 信息 沟通 。1994 年 ,一 家 叫做 Progressive Networks 的 美国 公司 成 立 , 自 此 流 
媒体 正式 在 互联 网 中 登场 亮相 。1995 年 ,他 们 推出 了 C/S 架构 的 音频 传输 系统 Real 
Audio ,并 在 随后 的 几 年 内 引领 了 网 络 流 式 技术 发 展 的 潮流 。1997 年 9 月 ,该 公司 更 名 为 
Real Networks ,相继 发 布 了 多 款 应 用 非常 广泛 的 流 媒 体 播放 器 一 -Realplayer 系列 。 其 在 
鼎盛 时 期 , 曾 一 度 占据 该 领域 超过 85% 的 市 场 份额 。Real Networks 公司 可 以 称 得 上 是 流 
媒体 真正 意义 上 的 始祖 。 

在 移动 互联 网 普及 的 今天 , 流 媒 体 也 开始 进入 戏 入 式 应 用 领域 ,如 数字 电视 机 顶 盒 、 
PDA 手机 等 ,针对 嵌入 式 设 备 的 实时 流 媒 体 传输 已 经 无 处 不 在 了 ,各 种 实时 流 媒体 标准 和 
协议 也 非常 丰富 。 

11. 用 户 编程 接口 


为 了 让 用 户 方便 地 使 用 操作 系统 ,操作 系统 向 用 户 提供 了 接口 。 接 口 支 持 用 户 与 操作 
系统 之 间 进 行 交互 , 即 由 用 户 向 操作 系统 提出 特定 的 服务 请 求 ,而 操作 系统 则 把 服务 结果 返 
回 给 用 户 。 接 口 通常 采用 命令 .系统 调用 或 者 图 形 接口 的 形式 。 命 令 直接 通过 键盘 使 用 , 系 
统 调用 则 提供 给 用 户 在 编程 时 使 用 。RTOS 同样 提供 以 上 3 种 接口 形式 ,但 是 由 于 艇 入 式 
系统 自身 的 性 质 ,以 往 的 RTOS 往往 只 提供 前 两 种 接口 方式 。 随 着 嵌入 式 技术 的 发 展 和 用 
户 要求 的 提高 ,目前 多 数 的 RTOS 也 提供 了 图 形 接口 。 


12. 嵌入 式 的 GUI 


近年 来 的 市 场 需求 显示 , 越 来 越 多 的 嵌入 式 系统 ,包括 PDA、 机 顶 合 ,DVD/VCD 播放 
器 `WAP 手机 等 , 均 要 求 提供 全 功能 的 Web 浏览 器 ,其 中 包括 对 HTML、XML JavaScript 
的 支持 ,甚至 包括 对 Java 虚拟 机 的 支持 。 这 一 切 均 要 求 有 一 个 高 性 能 .高 可 靠 性 的 图 形 用 
户 界面 支持 。 

另 一 个 迫切 需要 轻 量 级 GUI 的 系统 是 工业 实时 控制 系统 。 这 类 系统 一 般 建立 在 标准 
PC 上 ,硬件 条 件 较 好 ,但 对 实时 性 的 要 求 非常 高 .而 且 对 GUI 的 要 求 比 前 一 种 情况 更 高 。 

此 外 ,嵌入 式 系统 往往 是 一 种 定制 设备 ,它们 对 GUI 的 需求 也 各 不 相同 。 有 的 系统 只 
要 求 一 些 简单 的 图 形 功能 ,甚至 不 需要 ,而 有 些 系统 则 要 求 完整 的 GUI 支持 。 因 此 ,GUI 的 
可 配置 性 显得 十 分 重要 。 

上 述 各 种 情况 都 显示 出 GUI 在 嵌入 式 及 实时 系统 中 的 地 位 越 来 越 重 要 。GUI 应 满足 
轻型 .占有 资源 少 、 高 可 靠 性 、 可 配置 等 基本 要 求 。 
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@.4 嵌入 式 操作 系统 的 应 用 领域 


嵌入 式 操作 系统 广泛 地 应 用 于 工业 控制 .智能 家 电 、 交 通 控 制 . 网 络 POS、 家 居 智 能 化 、 
事 和 移动 互联 网 等 领域 , 正 努 力 把 网 络 连 接 到 人 们 生活 的 各 个 角落 ,改变 着 人 与 人 的 交互 
方式 以 及 人 与 自然 的 交互 方式 。 


网 








1. 工业 控制 


嵌入 式 操作 系统 已 经 广泛 被 应 用 于 工业 控制 领域 ,而 且 作 为 诅 入 式 软件 的 一 种 主流 应 
用 ,产生 了 巨大 的 经 济 价值 。 典 入 式 操作 系统 在 工业 控制 领域 中 占有 举足轻重 的 地 位 ,工业 
领域 对 智能 化 的 自动 控制 提出 了 更 高 的 要 求 , 嵌 入 式微 处 理 器 要 进一步 提高 运算 速度 和 集 
成 度 .可 靠 性 和 可 扩充 能 力 。 应 用 于 工业 控制 领域 的 嵌入 式 操 作 系 统 必 须 具 有 高 实时 性 。 
随 着 高 速 发 展 的 技术 ,32 位 和 64 位 的 微 处 理 器 将 逐步 成 为 新 型 工业 控制 系统 的 核心 ,并 在 
未 来 获得 显著 的 发 展 。 


2. 智能 家 电 


智能 家 电 是 在 传统 家 电 基 础 上 融入 传感器 技术 、 微 处 理 器 和 通信 技术 后 所 形成 的 智能 
化 的 家 电 产 品 ,能 够 感知 所 在 位 置 的 空间 状态 及 家 电 运 行 状 态 ,能够 自动 接收 房屋 主人 在 房 
间 内 或 通过 远程 发 出 的 指令 。 与 传统 家 电 相 比 ,智能 家 电 相 当 于 模拟 了 人 的 智能 ,产品 由 微 
处 理 器 和 传感器 捕获 信息 并 进行 相应 的 处 理 , 可 以 根据 住宅 环境 及 用 户 需求 进行 自动 控制 。 
嵌入 式 操作 系统 最 大 的 应 用 领域 是 智能 家 电 , 冰 箱 、 洗 衣 机 、 电 压力 锅 等 的 智能 化 将 人 类 的 
生活 带 入 一 个 全 新 的 世界 。 即 使 主人 不 在 家 ,也 能 够 预先 设 定好 其 自动 工作 方式 ,或 者 通过 


3. 交通 控制 


智能 交通 系统 (ITS) 主 要 由 交通 信息 采集 ,交通 状况 监视 .交通 控制 .信息 发 布 和 通信 5 
大 子 系统 组 成 。 各 类 信息 都 作为 ITS 运行 的 基础 ,而 嵌入 式 的 交通 控制 系统 在 整个 ITS 中 
发 挥 着 重要 的 指控 作用。 在 运输 车 队 遥 控 指挥 系统 、 测 速 雷 达 、 车 辆 导航 等 系统 中 ,嵌入 式 
操作 系统 能 够 完成 交通 信息 的 获取 、 显 示 、 存 储 、 分 析 、 传 输 和 管理 ,为 交通 管理 或 决策 者 提 
供 实时 的 交通 状况 ,以 便 进行 控制 和 决策 。GPS 导航 设备 几乎 在 每 个 拥有 私家 车 的 家 庭 普 
及 ,只 需要 花费 几 千 元 ,就 能 够 随时 知道 自己 的 位 置 , 也 可 以 通过 导航 的 帮助 到 达 任何 你 想 
去 的 地 方 。 


4. 网 络 POS 





网 络 POS 是 一 种 特殊 的 第 三 方 支付 平台 ,为 个 人 与 企业 进行 在 线 支付 提供 了 一 个 中 间 
环境 。 它 能 够 连接 多 个 金融 机 构 和 商业 银行 ,支持 国内 主要 商业 银行 发 行 的 各 类 银行 卡 ,可 
完成 跨 区 域 .跨行 的 实时 支付 。 
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5. 家 居 智 能 化 


家 居 智 能 化 可 实现 下 列 智能 管理 : 同 来 访客 人 通话 和 单元 入 口 门 锁 控 制 ; 厨房 的 燃气 
报警 ; 紧急 呼救 ; 水 、 电 、 暖 、 燃 气 的 自动 计 费 ; 家 电 的 远程 控制 和 智能 控制 。 这 些 功 能 都 是 
在 嵌入 式 操作 系统 的 控制 下 实现 的 。 家 居 智 能 化 体现 了 未 来 家 居 发 展 的 方向 ,这 确实 给 人 
类 的 生活 带 来 很 多 方便 。 


6. 机 器 人 


机 器 人 技术 广泛 被 应 用 于 商业 、 服 务 业 、 工 业 控制 等 诸多 领域 。 不 论 是 传统 工业 中 用 来 
生产 加 工 的 机 器 人 还 是 在 现代 娱乐 生活 中 用 于 丰富 人 们 生活 的 机 器 人 ,与 嵌入 式 操作 系统 
都 是 密 不 可 分 的 。 髋 入 式 操 作 系 统 的 发 展 定 将 提升 机 器 人 的 智能 化 程度 。 租 入 式 芯 片 与 典 
入 式 操作 系统 的 发 展 使 得 机 器 人 更 加 微型 化 ,更 加 智能 化 ,并 且 在 价格 方面 会 有 比较 大 幅度 
的 下 调 ,这 将 使 其 更 广泛 地 被 应 用 于 多 个 领域 中 。 

7. 军事 领域 

嵌入 式 操作 系统 被 广泛 应 用 在 雷达 探测 、 电 子 对 抗 武器 装备 等 军事 领域 。 例 如 网 入 式 
机 器 视觉 系统 可 以 用 于 制导 ,可 以 由 图 像 采集 部 分 获取 目标 图 像 信息 与 弹药 运行 轨迹 图 像 
信息 ,由 图 像 处 理 部 分 直接 对 运行 轨迹 做 出 相应 调整 。 当 今 我 国 军队 建设 的 最 终 目 标 就 是 
建设 数字 化 部 队 , 在 机 械 化 部 队 的 基础 上 ,广泛 应 用 嵌入 式 技术 , 集 电 子 对 抗 、 预 警 探测 、 情 
报 侦察 及 指挥 控制 于 一 体 ,实现 军事 装备 信息 化 。 


8. 移动 互联 网 领域 

移动 互联 网 领域 在 很 多 情况 下 也 需要 嵌入 式 开 发 技术 。 移 动 互联 网 已 进入 快速 发 展 
期 ,虽然 苹果 、 谷 歌 . 安 卓 目 前 在 智能 手机 操作 系统 领域 中 堪 称 巨头 ,但 系统 软件 技术 以 及 与 
之 对 应 的 应 用 技术 ,芯片 技术 的 创新 从 未 间断 。 


6.5 典型 的 嵌入 式 操作 系统 





9.5.1 VxWorks 


VxWorks 是 美国 Wind River System 公司 于 1983 年 设计 开发 的 RTOS, 具 有 良好 的 持 
续 发 展 能 力 、 高 性 能 的 内 核 以 及 友好 的 用 户 开发 环境 ,在 硬 实时 RTOS 领域 占据 统治 地 位 。 

VxWorks 的 开放 结构 和 对 工业 标准 的 支持 ,使 开发 者 只 需要 做 少量 工作 即 可 设计 出 有 
效 的 、 满 足 不 同 用 户 需 要 的 实时 系统 。VxWorks 的 开发 环境 是 Tornado。Tornado 集成 开 
发 环境 提供 高 效 、 明 晰 的 图 形 化 实时 应 用 开发 平台 ,包括 一 套 完整 的 .面向 嵌入 式 系统 的 开 
发 和 调试 工具 。 

VxWorks 操作 系统 的 内 核 由 多 任务 调度 (采用 基于 优先 级 抢占 方式 ,同时 支持 同 优先 
级 任务 间 的 分 时 间 片 调度 ) ,任务 间 的 同步 、 进 程 间 通信 机 制 . 中 断 处 理 、 定 时 器 和 内 存 管理 
机 制 组 成 。VxWorks 提供 了 一 个 快速 灵活 的 与 ANSI C 兼容 的 1/0 系统 ,包括 UNIX 标准 
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的 Basic I/O[create() remove() .open() ,close() read() 、write() 和 ioctl()]、Buffer I/O 
[fopen() 、fclose()、fread()、write()、getc()、putc()] 以 及 POSIX 标准 的 异步 IV/O。 
VxWorks 包括 网 络 驱动 .管道 驱动 .RAM 盘 驱 动 、SCSI 驱动 .键盘 驱动 .显示 驱动 .磁盘 驱 
动 . 并 口 驱动 等 驱动 程序 。 

VxWorks 支持 4 种 文件 系统 : DOSFS、 rtllFs、 rawFs 和 tapeFs。 支 持 在 一 个 单 
VxWorks 系统 上 同时 并 存 几 个 不 同 的 文件 系统 。 板 级 支持 包 BSP (Board Support 
Package) 向 VxWorks 操作 系统 提供 了 对 各 种 板子 的 硬件 功能 操作 的 统一 的 软件 接口 。 它 
是 保证 VxWorks 操作 系统 可 移植 性 的 关键 ,包括 硬件 初始 化 .中 断 的 产生 和 处 理 、 硬 件 时 
钟 管理 和 计时 器 管理 ,局 域 和 总 线 内 存 地 址 映射 \ 内 存 分 配 等 。 每 个 板 级 支持 包 包 括 一 个 
ROM 启动 (Boot ROM) 或 其 他 启动 机 制 。 

VxWorks 提供 了 对 其 他 VxWorks 系统 和 TCP/P 网 络 系统 的 透明 访问 ,包括 与 BSD 
套 接 字 兼容 的 编程 接口 远程 过 程 调用 (RPC) .SNMP、 远 程 文件 访问 (包括 客户 端 和 服务 端 
的 NFS 机制 以 及 使 用 RSH、FTP 或 TFTP 的 非 NFS 机 制 ) 以 及 BOOTP 和 代理 ARP、 
DHCP .DNS.OSPF RIP。 无 论 是 松 耦合 的 串 行 线路 、 标 准 的 以 太 网 连接 ,还 是 紧 耦 合 的 利 
用 共享 内 存 的 背 板 总 线 , 所 有 的 VxWorks 网 络 机 制 都 遵循 标准 的 Internet 协议 。 

在 Tornado 开发 系统 中 ,开发 工具 是 驻 留 在 主机 上 的 。 但 是 ,也 可 以 根据 需要 将 基于 
目标 机 的 Shell 和 装载 / 印 载 模块 加 入 VxWorks 中 。 

巾 入 式 VxWorks 系统 的 应 用 领域 主要 有 以 下 几 方 面 : 

(1) 数据 网 络 ,如 以 太 网 交换 机 、 路 由 器 、 远 程 接 入 服务 器 等 。 

(2) 远程 通信 ,如 电信 用 的 专用 分 组 交换 机 和 自动 呼叫 分 配器 等 。 

(3) 医疗 设备 ,如 放射 理疗 设备 等 。 

(4) 消费 电子 ,如 个 人 数字 助理 等 。 

(5) 交通 运输 ,如 导航 系统 、 高 速 火车 控制 系统 等 。 

(6) 工业 ,如 机 器 人 等 。 

(7) 航空 航天 ,如 卫星 跟踪 系统 等 。 

(8) 多 媒体 ,如 电视 会 议 设备 等 。 

(9) 计算 机 外 部 设备 ,如 XX 终端 I/O 系统 等 。 

总 之 ,VxWorks 的 系统 结构 是 一 个 相当 小 的 微 内 核 的 层次 结构 。 内 核 仅 提供 多 任务 环 
境 、 进 程 间 通信 和 同步 功能 。 这 些 功 能 模块 足够 支持 VxWorks 在 较 高 层次 所 提供 的 丰富 


9.5:2 QNX 


QNX 是 一 个 实时 嵌入 式 网 络 操作 系统 , 它 具 有 微 内 核 . 基 于 优先 级 、 消 息 传递 .抢占 式 
多 任务 、 多 用 户 . 具 有 容错 能 力 、 分 布 式 等 特点 。 它 遵循 POSIX. 1 程序 接口 .POSIX. 2 Shell 
和 工具 标准 ,部 分 遵循 POSIX. 1b 实时 扩展 标准 。 

QNX 具有 真正 的 微 内 核 体系 结构 ,QNX 有 一 个 非常 小 的 内 核 ( 约 为 12KB) ,其 核心 仅 
提供 4 种 基本 服务 : 进程 调度 、 进 程 间 通信 、 底 层 网 络 通信 和 中 断 处 理 ,这 些 基 本 进程 在 独 
立 的 地 址 空间 运行 ,并 通过 消息 传输 机 制 与 系统 其 他 各 模块 进行 通信 。 这 一 机 制 使 得 QNX 
能 够 胜任 对 实时 性 要 求 很 高 的 系统 。 
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QNX 操作 系统 由 Neutrino 内 核 管理 下 的 一 组 相互 协作 的 进程 构成 。 该 结构 是 一 个 同 
级 结构 ,不 是 等 级 结构 ; 相互 协作 间 的 进程 的 地 位 是 平等 的 ,并 且 通 过 内 核 管理 。 微 内 核 扮 
演 的 角色 是 “软件 总 线 ”, 可 以 实现 用 户 根 据 需求 动态 地 * 插 入 ”或 “ 拔 出 ”系统 组 件 的 要 求 。 
内 核 是 操作 系统 的 核心 , 它 不 同 于 系统 的 其 他 线程 , 它 本 身 并 不 参与 系统 调度 ; 处 理 器 仅 在 
内 核 调用 、 响 应 中 断 、 底 层 网 络 通 信和 进程 间 通信 的 时 候 才 执行 内 核 代码 。 

除了 微 内 核 提供 的 4 种 基本 系统 服务 外 ,其 他 系统 服务 都 由 标准 用 户 进程 提供 。 一 个 
配置 良好 的 系统 需要 包含 资源 管理 器 文件 系统 管理 器 .字符 设备 管理 器 .用户 图 形 接口 、 基 
本 网 络 管理 器 `.TCP/IP 服务 等 。 从 本 质 上 来 说 ,系统 进程 和 用 户 进程 已 经 很 难 区 分 了 , 因 
为 用 户 自 定义 的 系统 扩展 的 服务 和 应 用 程序 使 用 了 相同 的 接口 和 微 内 核 服 务 , 只 不 过 扩展 
的 系统 服务 满足 POSIX 标准 。 从 用 户 角 度 看 来 ,扩展 的 系统 模块 就 像 系统 内 核 一 样 向 应 用 
程序 提供 核心 服务 。 由 此 可 见 ,QNX 的 特殊 微 内 核 体系 结构 赋予 了 系统 独特 的 可 扩展 性 。 
多 数 高 级 的 系统 服务 都 由 标准 的 系统 进程 提供 ,因此 很 容易 增加 系统 的 服务 。 

QNX 是 同类 骨 入 式 系统 中 首先 采用 消息 传递 技术 作为 进程 间 通 信 (IPC) 基 本 方式 的 
商业 嵌入 式 操 作 系 统 。 该 系统 的 强大 功能 和 结构 简单 性 要 归功 于 整个 系统 整合 了 消息 传递 
机 制 。 在 QNX 里 ,一 个 消息 是 在 进程 间 传 递 的 很 小 的 数据 包 。 系 统 并 没有 定义 消息 的 内 
容 , 也 没有 赋予 其 任何 特殊 的 含义 ,只 是 让 消息 的 发 送 者 和 接收 者 能 理解 消息 内 数据 的 含 
义 。 消 息 传递 不 仅 允许 进程 间 相 互 传递 数据 ,而 且 为 多 进程 同步 提供 了 方法 。 当 发 送 、 接 收 
和 应 答 消 息 的 事件 发 生 时 ,进程 本 身 的 状态 也 发 生 了 变化 ,这 些 状态 变化 影响 着 进程 的 运 
行 , 主 要 是 运行 状态 。 一 旦 内 核 知道 进程 的 状态 和 优先 级 ,就 可 以 根据 这 些 状态 对 所 有 的 进 
程 进行 高 效 的 调度 ,以 使 CPU 的 资源 得 到 高 效 的 利用 。 

在 QNX 中 ,进程 可 以 要 求 这 些 请 求 消息 按 优先 级 递送 (而 不 是 以 提交 时 间 为 次 序 ) ,高 
优先 级 进程 将 阻塞 低 优 先 级 的 进程 。 这 种 消息 驱动 的 优先 级 机 制 巧妙 地 避免 了 优先 级 逆 
转 。 例 如 ,一 个 进程 正在 使 用 某 项 临界 资源 ,这 时 有 一 个 更 高 优先 级 的 进程 也 要 使 用 这 个 资 
源 , 因 为 是 临界 资源 ,所 以 高 优先 级 的 进程 被 阻塞 , 遇 到 这 种 情况 系统 会 自动 将 占用 临界 资 
源 的 低 优先 级 进程 的 优先 级 提高 到 适当 级 别 , 使 其 与 被 阻塞 的 高 优先 级 的 进程 优先 级 别 相 
近 或 相等 ,这 样 原先 低 优先 级 的 进程 可 以 很 快 地 执行 完 ,然后 释放 临界 资源 ,消除 低 优先 级 
的 进程 对 高 优先 级 进程 的 阻塞 。 

QNX 的 应 用 范围 极 广 ,例如 保时捷 跑车 的 音乐 和 媒体 控制 功能 核电站、 美国 陆军 无 人 
驾驶 Crusher 坦克 的 控制 系统 ,还 有 RIM 公司 的 BlackBerry PlayBook 平板 电脑 等 。 


9.5.3 由 入 式 Linux 


嵌入 式 Linux 操作 系统 是 将 日 益 流行 的 Linux 操作 系统 进行 裁剪 修改 ,使 之 能 在 幅 入 
式 计算 机 系统 上 运行 的 一 种 操作 系统 。 嵌 入 式 Linux 既 继 承 了 因特网 上 无 限 的 开放 源 代码 
资源 ,又 具有 能 入 式 操 作 系统 的 特性 。 嵌 入 式 Linux 的 特点 是 版 权 免费 ,向 全 世界 的 自由 软 
件 开发 者 免费 提供 对 网 络 特 性 的 支持 ,而 且 性 能 优异 ,软件 移植 容易 , 源 代码 开放 ,有 许多 应 
用 软件 支持 ,应 用 产品 开发 周期 短 ,新 产品 上 市 迅速 ,实时 性 能 稳定 、 安 全 。 

嵌入 式 Linux 优势 明显 。 首 先 ,Linux 是 开放 源 代 码 的 ,不 存在 黑箱 技术 ,遍布 全 球 的 
众多 Linux 爱好 者 又 是 Linux 开发 者 的 强大 技术 支持 ; 其 次 ,Linux 内 核 小 ,效率 高 ,内 核 的 
更 新 速度 快 。Linux 是 可 以 定制 的 ,其 系统 内 核 最 小 只 有 约 134KB。 由 于 Linux 是 免费 的 
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操作 系统 ,在 价格 上 极 具 竞争 力 。 

Linux 还 有 嵌入 式 操 作 系统 所 需要 的 很 多 优点 ,比较 突出 的 是 Linux 适用 于 多 种 CPU 
和 多 种 硬件 平台 ,是 一 个 跨 平台 的 系统 。 到 目前 为 止 , 它 可 以 支持 30 余 种 CPU, 而 且 性 能 
稳定 ,裁剪 性 很 好 ,开发 和 使 用 都 很 容易 。 因 此 ,有 很 多 CPU 包括 家 电 业 芯片 做 Linux 的 平 
台 移 植 工 作 ,移植 的 速度 远 远 超过 了 Java 的 开发 环境 。 同 时 ,Linux 内 核 的 结构 在 网 络 方 
面 是 非常 完整 的 ,Linux 对 网 络 中 最 常用 的 TCP/IP 有 最 完备 的 支持 。 所 以 ,Linux 很 适合 
做 信息 家 电 的 开发 。 

目前 ,内 入 式 Linux 在 智能 数字 终端 领域 ,移动 计算 平台 智能 工控 设备 、 金 融 业 终端 系 
统 甚至 军事 领域 都 得 到 了 很 好 的 应 用 。 岩 入 式 Linux 风靡 全 球 的 主要 原因 有 : 开放 源 代 
码 , 拥 有 丰富 的 软件 资源 ; @ 具 有 功能 强大 的 内 核 , 性 能 高 效 、 稳 定 ,支持 多 任务 ; @@ 支 持 多 
种 体系 结构 ; @ 具 备 完整 的 网 络 通 信 、 图 形 和 文件 管理 机 制 ; @ 支 持 大量 的 周边 硬件 设备 ， 
驱动 程序 丰富 ; @ 大 小 和 功能 都 可 以 定制 。 

同时 ,国内 外 不 少 大 学 、 研 究 机 构 和 知名 公司 都 加 入 了 舱 入 式 Linux 的 开发 工作 ,比较 
成 熟 的 嵌入 式 Linux 产品 不 断 出 现 。 主 要 有 以 下 几 个 。 


1. RTLinux 


RTLinux 是 一 个 髋 入 式 硬 实时 操作 系统 ,部 分 支持 POSIX. 1b 标准 。 它 的 开发 始 于 美 
国 新 墨西哥 州 矿业 大 学 ,目前 由 FSMLabs 公司 进行 开发 工作 , 受 美国 专利 保护 。 从 整体 结 
构 看 RTLinux 属于 双 内 核 结 构 。 它 实现 了 一 个 小 的 实时 内 核 , 仅 支持 底层 任务 创建 ,ISR 
的 装 入 、 底 层 任务 间 通 信和 队列 、ISR 和 实时 任务 调度 ,所 有 可 抢占 的 任务 都 运行 于 这 个 小 核 
心 之 上 。 原 来 的 Linux 内 核 作 为 实时 内 核 上 的 一 个 任务 调度 , 称 为 基本 内 核 ,而 所 有 非 实 时 
任务 均 由 该 基本 内 核 调 度 执 行 。 这 种 处 理 方式 既 保留 了 Linux 操作 系统 所 提供 的 丰富 功 
能 ,又 将 其 改动 成 为 硬 实 时 内 核 。 基 本 内 核 可 以 看 作 实 时 系统 的 空闲 任务 ,只 在 没有 实 
时 处 理 要求 的 时 候 运行 。 目 前 ,RTLinux 支持 x86、ARM、PowerPC、Alpha 和 MIPS 架构 。 
开发 环境 是 业界 广泛 使 用 的 GNU 工具 链 。 另 外 ,RTLinux 内 核 也 提供 对 实时 模块 的 

2. uCLinux 


LCLinux 是 对 Linux 进行 小 型 化 改造 得 到 的 高 度 优化 代码 紧 凑 的 嵌入 式 Linux, 完 全 
符合 GNU/GPL( General Public License) 公 约 , 并 开放 源 代码 。 虽 然 体 积 很 小 ,但 jyCLinux 
仍然 保留 了 Linux 的 大 多 数 优 点 : 稳定 、 良 好 的 移植 性 、 优 秀 的 网 络 功 能 、 对 各 种 文件 系统 
的 完备 支持 以 及 标准 而 丰富 的 API。 内 存 管理 是 jyCLinux 与 标准 Linux 的 最 大 区 别 。 标 
准 Linux 使 用 的 是 虚拟 存储 器 技术 ,而 uCLinux 没有 存储 管理 部 件 (MMU) ,所 以 采用 实 存 
储 器 管理 策略 。pCLinux 有 完整 的 TCP/IP 协议 栈 , 支 持 大 量 其 他 的 网 络 协议 ,支持 NFS、 
EXT2、ROMFS、JFFS、FAT16/32 等 文件 系统 ,支持 GNU 编译 器 和 命令 行 调试 器 GDB。 


3. Embedix 


Embedix 由 嵌入 式 Linux 行业 的 主要 厂商 之 一 的 Lineo 公司 推出 ,是 根据 柑 入 式 系 统 
的 特点 重新 设计 的 能 入 式 Linux。Embedix 提供 25 种 Linux 系统 服务 ,包括 Web 服务 等 。 
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系统 需要 最 少 8MB 内 存 ,3MB 闪存 ,基于 Linux 2. 2 的 核心 。Lineo 公司 还 发 布 了 另 一 个 
重要 的 软件 产品 ,可 以 让 在 Windows CE 操作 系统 中 运行 的 程序 直接 在 Embedix 系统 中 运 
行 。Lineo 公司 还 计划 推出 Embedix 的 开发 调试 工具 包 、 基 于 图 形 界面 的 浏览 器 等 。 


4. XLinux 


XLinux 是 由 美国 网 虎 公 司 开发 的 。 它 号 称 是 世界 上 最 小 的 内 入 式 Linux, 核 心 只 有 
143KB, 而 且 还 在 不 断 减 小 。Linux 核心 采用 了 “ 超 字符 元 集 ” 专 利 技术 ,使 Linux 核心 不 仅 
可 以 与 标准 字符 集 相 容 ,而 且 涵 盖 12 个 国家 的 字符 集 。 


5. 其 他 产品 


一 些 从 事 能 入 式 Linux 研发 的 大 学 、 研 究 机 构 和 知名 公司 也 推出 了 相应 的 产品 ,如 广州 
博 利 思 软 件 公司 的 PocketIX, 中 国 科学 院 计 算 技术 研究 所 的 红旗 嵌入 式 Linux 等 。 


9.5.4 Windows CE 


Windows CE 操作 系统 是 微软 公司 于 1996 年 发 布 的 一 款 舱 入 式 操作 系统 ,是 一 个 简 
洁 、 高 效 的 多 平台 操作 系统 。 它 不 是 桌面 Windows 系统 的 削减 版 本 ,而 是 从 整体 上 为 有 限 
资源 的 平台 设计 的 多 线程 .具有 完整 优先 权 、 多 任务 的 操作 系统 。Windows CE 由 许多 离散 
模块 构成 ,每 一 模块 都 提供 特定 的 功能 ,这 些 模 块 中 的 一 部 分 被 划分 成 组 件 。 组 件 化 使 得 
Windows CE 相对 紧凑 ,其 基本 内 核 只 占 不 到 200KB 的 ROM 空间 。 

Windows CE 的 基本 内 核 提 供 操作 系统 最 关键 的 4 个 功能 模块 : 内 核 模 块 、 对 象 存储 
模块 图 形 、 窗 口 和 事件 子 系统 模块 以 及 通信 模块 , 男 外 还 提供 一 些 附 加 的 可 选择 模块 ,用 于 
支持 设备 管理 ,多 媒体 管理 .COM 组 件 等 。 

Windows CE 具有 模块 化 ,结构 化 、 基 于 Win32 应 用 程序 接口 和 与 处 理 器 无 关 等 特点 。 
Windows CE 不 仅 继承 了 传统 的 Windows 图 形 界 面 , 并 且 在 Windows CE 平台 上 可 以 使 
Windows 95/98 上 的 编程 工具 (如 Visual Basic、Visual C++ 等 ) ,使 用 同样 的 函数 ,使 用 同样 
的 界面 风格 ,使 绝 大 多 数 的 应 用 软件 只 需 简单 地 修改 和 移植 就 可 以 在 Windows CE 平台 上 
继续 使 用 。Windows CE 并 非 是 专 为 单一 装置 设计 的 ,微软 旗下 采用 Windows CE 操作 系 
统 的 产品 大 致 分 为 3 条 产品 线 : Pocket PC (掌上 电脑 )、Handhold PC (手持 设 备 ) 及 
Auto PC。 

Windows CE 的 版 本 很 多 ,主要 有 1.0、2.0、3.0、4.0、4.2、5.0 和 6.0。Windows CE 
6.0 诞生 于 2006 年 11 月 ,作为 业内 领先 的 软件 工具 ,Windows CE 6. 0 将 为 多 种 设备 构建 
实时 操作 系统 ,例如 互联 网 协议 (IP) 机 顶 盒 、 全 球 定位 系统 (GPS) 、 无 线 投影 仪 .各 种 工业 自 
动 化 设备 、 消 费 电 子 以 及 医疗 设备 等 。 

目前 ,Windows CE 7. 0 是 Windows CE 的 最 新 版 本 ,该 版 本 在 内 核 部 分 有 很 大 的 
进步 : 

(1) 所 有 系统 元 件 都 由 EXE 改 为 DLL, 并 移 到 kernel space 上 。 

(2) 全 新 设计 的 虚拟 内 存 架构 。 

(3) 全 新 的 设备 驱动 程序 架构 ,同时 支持 用 户 模式 与 内 核 模式 两 种 驱动 程序 。 突 破 了 
只 能 运行 32 个 进程 的 限制 ,可 以 运行 32 768 个 进程 。 每 一 个 进程 的 虚拟 内 存 限制 由 32MB 
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增加 到 全 系统 总 虚拟 内 存 。Platform Builder IDE 集成 到 Microsoft Visual Studio 2005 , 采 
用 新 的 安全 架构 ,确保 只 有 被 信任 的 软件 可 以 在 系统 中 运行 。UDF 2. 5 文件 系统 ,支持 
IEEE 802. 11i(WPA2) 及 IEEE 802. 11e(QoS) 等 无 线 规格 及 多 重 无 线 支持 。 

(4) 支持 x86、ARM、SH4、MIPS 等 各 种 处 理 器 ,提供 新 的 Bellcore Components ,使 系 
统 在 移动 电话 网 络 中 更 容易 创建 数据 链接 及 激活 通话 。 

与 Windows CE 相 比 ,嵌入 式 Linux 操作 系统 的 优势 有 5 个 方面 : 

(1) Linux 开放 源 代 码 ,遍布 全 球 的 众多 Linux 爱好 者 都 是 Linux 开发 者 的 强大 技术 支 
持 。 目 前 ,Windows CE 6.0 内 核 全 部 开放 ,GUI 不 开放 。 

(2) Linux 的 内 核 小 ,效率 高 。 相 比 之 下 ,Windows CE 占用 过 多 的 RAM。 

(3) Linux 是 开放 源 代码 的 操作 系统 ,在 价格 上 极 具 竞争 力 ,适合 中 国 国 情 。 而 
Windows CE 需要 版 权 费 用 。 

(4) Linux 不 仅 支 持 x86 芯片 ,还 是 一 个 路 平台 的 系统 ,更 换 CPU 时 就 不 会 遇 到 更 换 
平台 的 困扰 。 

(5) Linux 内 核 的 结构 在 网 络 方面 是 非常 完整 的 , 它 提供 了 对 包括 十 兆 位 、 百 兆 位 及 千 
兆 位 的 以 太 网 ,无线 网 络 .Token ring( 令 牌 环 ) 和 光纤 甚至 卫星 的 支持 。 目 前 ,Windows CE 
的 网 络 功能 也 比较 强大 。 

乱入 式 Linux 操作 系统 的 弱点 也 是 明显 的 : 

(1) Linux 开发 难度 较 高 ,需要 很 高 的 技术 实力 ; Windows CE 开发 相对 容易 ,开发 周 
期 短 , 内 核 完善 ,主要 是 应 用 层 开发 。 

(2) Linux 核心 调试 工具 不 全 ,调试 不 太 方便 ,还 没有 很 好 的 用 户 图 形 界面 ;Windows 
CE 的 GUI 丰富 ,开发 工具 强大 。 

(3) 系统 维护 难度 大 。Linux 占用 较 大 的 内 存 , 可 以 去 掉 部 分 无 用 的 功能 来 减 小 使 用 的 
内 存 , 但 是 如 果 不 仔细 ,将 引起 新 的 问题 。 

目前 ,使 用 Windows CE 开发 的 典型 产品 有 和 手机、 指纹 识别 系统 ,汽车 电子 检测 设备 、 智 
能 家 电 、 医 疗 仪器 (如 监护 仪 , 心 电 检测 仪 等 )`. 工 业 控制 仪器 (如 人 机 界面 显示 的 高 精准 电机 
控制 .工业 采集 控制 通信 等 ) .定位 导航 设备 (如 车 载 GPS 导航 仪 ) 等 。 


9.5.5 Android 


Android( 安 卓 ) 是 一 种 基于 Linux 的 开源 操作 系统 ,最 初 由 Andy Rubin 开发 ,主要 用 
手持 设备 ,如 智能 手机 、 平 板 电脑 等 。2005 年 ,谷歌 公司 注资 收购 Android ,并 组 建 了 手机 联 
盟 ,随后 逐渐 扩展 到 平板 电脑 及 其 他 领域 。 据 IDC 预计 ,Android 到 2019 年 将 占据 全 球 智 
能 手机 操作 系统 82.6% 的 市 场 份额 。 

Android 采用 分 层 架构 ,从 高 层 到 低层 分 别 是 应 用 程序 层 、 应 用 程序 框架 层 、 系 统 运行 
库 层 和 Linux 内 核 层 。 

Android 基于 Linux 2. 6 提供 核心 系统 服务 ,例如 安全 .内存 管理 .进程 管理 网络 堆 
栈 ,并 为 Android 设备 的 各 种 硬件 提供 了 底层 的 驱动 ,如 显示 驱动 .音频 驱动 .照相 机 驱动 、 
蓝牙 驱动 、WiFi 驱动 .电源 管理 等 。Linux 内 核 层 也 作为 硬件 和 软件 之 间 的 抽象 层 , 它 隐藏 
具体 硬件 细节 而 为 上 层 提供 统一 的 服务 。 

系统 运行 库 层 包 含 一 个 核心 库 的 集合 ,提供 大 部 分 在 Java 编程 语言 核心 类 库 中 可 用 的 
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功能 。 每 一 个 Android 应 用 程序 是 Dalvik 虚拟 机 中 的 实例 ,运行 在 它们 自己 的 进程 中 。 
Dalvik 虚拟 机 设计 成 在 一 个 设备 可 以 高 效 地 运行 多 个 虚拟 机 。Dalvik 虚拟 机 依赖 于 Linux 
内 核 提 供 的 基本 功能 ,如 线程 和 底层 内 存 管理 。Android 包含 一 个 C/C++ 库 的 集合 , 供 
Android 系统 的 各 个 组 件 使 用 。 这 些 功 能 通过 Android 的 应 用 程序 框架 (application 
framework) 提 供给 开发 者 。 

应 用 程序 框架 层 主要 提供 了 构建 应 用 时 可 能 用 到 的 API, Android 自 带 的 一 些 核心 应 
用 程序 就 是 使 用 这 些 API 完成 的 ,开发 者 可 以 通过 使 用 这 些 API 构建 自己 的 应 用 程序 ,如 
活动 管理 器 View 系统 ,内容 提 供 器 .通知 管理 器 等 。 应 用 程序 的 体系 结构 旨 在 简化 组 件 的 
重用 ,任何 应 用 程序 都 能 发 布 它 的 功能 且 任何 其 他 应 用 程序 可 以 使 用 这 些 功 能 (需要 服从 杠 
架 执 行 的 安全 限制 ) 。 

所 有 安装 在 手机 上 的 应 用 程序 都 属于 应 用 程序 层 ,包括 电子 邮件 客户 端 \SMS 程序 、 日 
历 ` 地 图 .浏览 器 .联系 人 和 其 他 设置 。 

开放 性 是 Android 平台 的 最 大 优势 。 开 放 的 平台 允许 任何 移动 终端 厂商 加 入 Android 
联盟 ,可 以 使 联盟 拥有 更 多 的 开发 者 。 随 着 用 户 和 应 用 的 日 益 丰富 ,Android 平台 将 很 快走 
向 成 熟 。 


9.5.6 iOS 


iOS 是 由 苹果 公司 开发 的 手持 设备 操作 系统 。 苹 果 公 司 于 2007 年 公布 iDOS, 最 初 只 是 
为 iPhone 设计 使 用 的 ,后 来 陆续 应 用 到 iPod Touch、iPad、Apple TV 等 产品 上 。iOS 以 
Darwin 为 基础 ,属于 类 UNIX 的 商业 操作 系统 。2011 年 11 月 的 Canalys 数据 显示 ,iOS 已 
经 占据 全 球 智 能 手机 操作 系统 市 场 份额 的 30% ,在 美国 的 市 场 占有 率 为 43% 。 

iOS 系统 结构 分 为 以 下 4 个 层次 : 核心 操作 系统 层 、 核 心服 务 层 、 媒 体 支 持 层 和 触摸 框 
架 层 。 与 Android 相 比 ,iOS 为 闭 源 系统 。 

核心 操作 系统 层 包 含 核 心 部 分 、 文 件 系统 、 网 络 基础 ,安全 特性 、 电 源 管理 和 一 些 设备 驱 
动 程序 ,还 有 一 些 系 统 级 别 的 API。 它 可 以 直接 和 硬件 设备 进行 交互 。 

核心 服务 层 提供 核心 服务 ,例如 字符 串 处 理 函 数 、 集 合 管理 .网络 管理 .URL 处 理工 具 、 
联系 人 维护 、 偏 好 设置 等 。 可 以 通过 它 来 访问 iOS 的 一 些 服 务 。 

媒体 支持 层 的 框架 和 服务 依赖 核心 服务 层 , 向 触摸 框架 层 提供 画图 和 多 媒体 服务 ,如 声 
音 、 图 片 、 视 频 等 。 通 过 它 可 以 在 应 用 程序 中 使 用 各 种 媒体 文件 ,进行 音频 与 视频 的 录制 .图 
像 的 绘制 以 及 制作 基础 动画 效果 。 

和 触摸 框架 层 为 应 用 程序 开发 提供 了 各 种 有 用 的 框架 ,并 且 大 部 分 与 用 户 界 面 有 关 , 本 质 
上 它 负责 用 户 在 iOS 设备 上 的 触摸 交互 操作 。 

iOS 具有 专 为 手指 触摸 而 设计 的 极 具 创 新 的 Multi-Touch 界面 。 此 外 ,iOS 内 置 的 全 
果 商 店 提 供 700 000 多 款 应 用 和 游戏 ,为 手机 使 用 带 来 了 方便 和 乐趣 。 





9.5.7 Symbian OS 


Symbian OS 是 一 个 专门 应 用 于 手机 等 移动 设备 的 嵌入 式 操作 系统 。 最 早 由 Psion( 宝 
意 昂 ) 公 司 开发 , 曾 得 到 诺基亚 、 爱 立信 、 松 下 三星、 索尼 爱立信 和 西门 子 等 手机 巨头 的 共同 
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拥护 ,曾经 占据 智能 手机 操作 系统 市 场 70% 以 上 的 份额 ,但 随 着 激烈 的 市 场 竞 争 ,目前 已 逐 
步 被 1OS、Android 所 取代 。 

Symbian OS 是 由 诺基亚 索尼 、 爱 立信、 摩托 罗拉 西门 子 等 几 家 大 型 移动 通信 设备 商 
共同 出 资 组 建 的 一 个 合资 公司 专门 研发 的 手机 操作 系统 , 现 已 被 诺基亚 全 额 收购 。 
Symbian 操作 系统 的 前 身 是 EPOC(Electronic Piece of Cheese) ,其 含意 为 “使 用 电子 产品 时 
可 以 像 吃 乳 酪 一 样 简单 ”。 

Symbian OS 在 智能 移动 终端 上 拥有 强大 的 应 用 程序 及 通信 和 能力 ,这 都 要 归功 于 它 有 一 
个 非常 健全 的 核心 强大 的 对 象 导 向 系统 ,企业 用 标准 通信 传输 协议 以 及 完美 的 Sun 
Java 语言 。Symbian 认为 无 线 通信 装置 除了 要 提供 声音 沟通 的 功能 外 ,同时 也 应 具有 其 他 
沟通 方式 ,如 触 控 笔 .键盘 等 。 在 硬件 设计 上 ,可 以 提供 许多 不 同 风格 的 外 形 , 如 使 用 真实 或 
虚拟 的 键盘 ; 在 软件 功能 上 可 以 容纳 许多 功能 ,包括 和 他 人 互相 分 享 信息 、 浏 览 网 页 发 送 / 
接收 电子 邮件 .传真 以 及 个 人 生活 行程 管理 等 。 此 外 ,Symbian OS 在 扩展 性 方面 为 制造 商 
预 留 了 多 种 接口 。Symbian OS 还 可 以 细 分 成 3 种 类 型 : Pearl .Quartz .Crystal ,分 别 对 应 普 
通 手机 、 智 能 手机 、Handheld PC 场合 的 应 用 。 

2000 年 ,爱立信 推出 了 R380sc 手机 ,采用 了 基于 Symbian 平台 的 EPOC 操作 系统 , 支 
持 WAP 上 网 ,支持 手写 识别 。2001 年 诺基亚 PDA 手机 9110 采用 了 正在 高 速 发 展 的 
AMD 公司 出 品 的 内 骨 式 CPU ,操作 系统 代号 GEOS ,内置 8MB 存储 空间 。 

为 了 更 强 有 力 地 支持 Symbian 平台 ,诺基亚 在 2001 年 成 立 了 名 为 Nokia Mobile 
Software 的 新 部 门 ,全 力 发 展 移动 通信 相关 的 软件 。 为 了 让 手机 厂商 有 更 多 的 选择 以 投入 
Symbian 手机 的 开发 ,诺基亚 发 展 出 3 种 不 同 的 用 户 界面 : Series 60、Series 80、Series 90。 
Series 60 主要 用 于 数字 键盘 手机 ,Series 80 是 为 完整 键盘 所 设计 的 ,Series 90 则 是 为 触 控 
笔 方式 而 设计 的 。 另 一 个 重要 的 平台 是 由 Symbian 投资 的 UIQ Technology 所 开发 
的 UlQ。 

Symbian OS 作为 一 款 已 经 相当 成 熟 的 操作 系统 ,具有 以 下 特点 : 

(1) 提供 无 线 通信 服务 ,将 计算 技术 与 电话 技术 相 结合 。 

(2) 操作 系统 固化 。 

(3) 相对 固定 的 硬件 组 成 。 

(4) 较 低 的 研发 成 本 。 

(5) 开放 的 开发 环境 。 

(6) 低 功 耗 ,高 处 理性 能 。 

(7) 系统 运行 安全 稳定。 

(8) 多 线程 运行 模式 。 

(9) 多 种 UI, 灵 活 ,简单 , 易 操 作 。 

Symbian 机 型 所 采用 的 硬件 配置 较 低 , 且 采 用 的 处 理 器 主 频 较 低 ,虽然 系统 可 以 使 其 获 
得 较 高 的 处 理 效 能 ,但 是 在 多 媒体 等 方面 的 表现 依然 不 尽 如 人 意 。 在 多 媒体 方面 ,Symbian 
OS 对 主流 的 媒体 格式 的 支持 性 较 差 。Symbian OS 虽然 采用 多 种 平台 来 适应 不 同人 群 的 各 
种 需要 ,但 是 这 也 给 Symbian OS 带 来 了 发 展 障碍 。 各 个 平台 之 间 的 第 三 方 软件 不 兼容 , 且 
软件 开发 商 多 专注 于 某 个 平台 ,大 大 减少 了 各 个 平台 上 可 用 的 第 三 方 软件 ,给 用 户 带 来 了 一 
定 的 不 便 。 版 本 之 间 兼 容 性 差 也 是 Symbian OS 需要 改进 的 地 方 , 每 当 新 版 本 的 Symbian 
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OS 发 布 并 有 产品 问世 时 ,系统 的 兼容 性 便 成 为 其 发 展 的 一 个 障碍 。 相 当 多 的 软件 需要 软 
件 开发 商 跟 进 ,开发 新 的 版 本 才能 得 以 解决 。 由 于 Symbian OS 只 提供 给 厂商 一 个 内 核 及 
UI, 很 多 细节 功能 需要 厂商 去 添加 ,但 是 很 多 厂商 将 着 眼 点 放 在 了 产品 的 多 功能 及 综合 性 
能 等 方面 ,往往 忽略 了 一 些 基 本 的 功能 。 一 些 机 型 甚至 连 工作 日 闹钟 这 类 功能 都 需要 第 三 
方 软件 实现 ,这 无 疑 给 不 熟悉 Symbian OS 的 用 户 带 来 了 极 大 的 不 便 。 


9.5.8 TinyOS 


TinyOS 是 美国 加 州 大 学 伯克利 分 校 针对 代码 量 小 、 能 耗 少 、 并 发 度 高 .内存 和 硬件 资 
源 稀缺 ,处理 能 力 有 限 的 嵌入 式 系统 开发 的 一 个 构件 化 的 RTOS, 目 前 基本 上 已 成 为 传感器 
网 络 节点 操作 系统 的 标准 ,为 面向 无 线 传感器 网 络 应 用 领域 的 系统 集成 提供 了 一 个 构件 化 
的 软件 框架 。 

TinyOS 操作 系统 、 库 和 服务 程序 都 用 nesC 编写 。nesC 是 一 种 组 件 化 程序 开发 语言 ， 
具有 C 语言 的 语法 风格 ,其 组 件 层 次 结构 类 似 一 个 网 络 协议 栈 : 底层 的 组 件 负责 接收 和 发 
送 原 始 的 数据 位 ,而 高 层 的 组 件 对 这 些 数据 进行 编码 、 解 码 ,更 高 层 的 组 件 负责 数据 打包 、 路 
由 和 传输 。 

TinyOS 的 组 件 分 为 3 种 类 型 : 硬件 抽象 组 件 、 合 成 硬件 组 件 和 高 层 软件 组 件 。 硬 件 抽 
象 组 件 对 物理 硬件 设备 进行 了 TinyOS 的 组 件 化 。 在 TinyOS 系统 平台 中 ,每 个 硬件 资源 
都 被 抽象 成 一 个 或 多 个 易于 操作 的 组 件 ,用 户 程序 访问 这 些 资源 时 只 需 调用 对 应 组 件 相应 
的 功能 接口 , 即 可 实现 对 硬件 的 操作 。 合 成 硬件 组 件 所 起 到 的 作用 即 为 将 硬件 抽象 组 件 与 
高 层 软 件 组 件 进行 连接 。 它 可 以 利用 硬件 抽象 组 件 提供 的 接口 实现 高 于 硬件 抽象 组 件 的 
功能 ,例如 对 字 节 的 发 送 与 接收 。 高 层 软 件 组 件 实现 了 对 整个 系统 的 控制 、 建 立 路 由 和 
数据 传输 等 。 多 个 下 层 组 件 可 以 连接 起 来 构成 上 一 层 更 大 的 组 件 , 而 最 上 层 的 组 件 就 是 
应 用 程序 。 

TinyOS 提供 任务 和 事件 的 两 级 调度 机 制 。 任 务 一 般 用 于 对 时 间 要 求 不 高 的 应 用 , 它 
实际 上 是 一 种 延 时 计算 机 制 。 任 务 之 间 互 相 平 等 ,没有 优先 级 之 分 ,所 以 任务 的 调度 采用 简 
单 的 FIFO 算法。 任务 之 间 互 不 抢占 , 即 任务 一 旦 运行 ,就 必须 执行 至 结束 ,只 有 当 任 务 主 
动 放弃 CPU 使 用 权时 才能 运行 下 一 个 任务 。 硬 件 事件 处 理 句柄 响应 硬件 中 断 , 它 可 以 抢 
占 任务 或 者 其 他 的 硬件 事件 处 理 句 柄 。 当 事件 被 触发 后 ,与 该 事件 相关 联 的 所 有 任务 迅速 
被 执行 , 当 这 个 事件 和 任务 被 处 理 完 成 之 后 ,CPU 进入 睡眠 状态 .直至 其 他 事件 将 它 唤 醒 。 
总 的 来 说 ,TinyOS 调度 模型 有 以 下 特点 : 

(1) 任务 单线 程 运 行 到 结束 ,只 分 配 单个 任务 栈 , 这 对 内 存 受 限 的 系统 很 有 利 。 

(2) 任务 调度 算法 采用 非 抢占 式 的 FIFO 算法 ,任务 之 间 相互 平等 ,没有 优先 级 之 分 。 

(3) TinyOS 的 调度 策略 具有 能 量 意识 , 当 任 务 队列 为 空 时 ,人 处理 器 进入 休眠 模式 ,直到 
外 部 事件 将 它 唤醒 ,能 有 效 降低 系统 能 耗 。 


空间 就 能 获得 高 度 的 并 发 性 。 
TinyOS 已 经 有 很 多 产品 ,例如 用 于 神经 信号 接收 、 解 调 、 显 示 的 接收 器 ,用 于 能 源 领域 
中 的 石油 和 气体 监控 ,用 于 传 感 网 络 的 控制 和 优化 ,用 于 无 线 传 感 网 络 进行 健康 监测 等 。 
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9.5.9 pC/OS 


4C/OS 是 开源 的 嵌入 式 实时 操作 系统 ,由 Jean J. Labrosse 编写 ,代码 共 5000 多 行 , 是 
学 习 者 了 解 和 学 习 RTOS 的 良好 范本 。 经 过 pC/OS 和 pC/OS 工 两 代 开 源 版 本 的 发 展 ,该 
RTOS 已 具有 优秀 特性 ,被 应 用 于 工业 设备 .航天 军事 设备 、 智 能 家 居 工程 机 械 、 汽 车 电子 、 
消费 娱乐 电子 .PDA 等 众多 领域 。 

4C/OS 开 是 一 个 占 先 式 的 内 核 , 即 已 经 准备 就 绪 的 高 优先 级 任务 可 以 剥夺 正在 运行 的 
低 优先 级 任务 的 CPU 使 用 权 。 这 个 特点 使 得 它 的 实时 性 比 非 占 先 式 的 内 核 要 好 。 通 常 都 
是 在 中 断 服务 程序 中 使 高 优先 级 任务 进入 就 绪 态 (如 发 送信 号 ) ,这 样 退出 中 断 服务 程序 后 ， 
将 进行 任务 切换 ,高 优先 级 任务 将 被 执行 。 但 是 ,由 于 中 断 响应 时 间 无 法 确定 ,所 以 系统 的 
实时 性 不 强 。 如 果 使 用 yC/OS 本 ,只 要 把 数据 处 理 程序 的 优先 级 设 定 得 高 一 些 , 并 在 中 断 
服务 程序 中 使 它 进 入 就 绪 态 ,中断 结束 后 数据 处 理 程序 就 会 被 立即 执行 。 对 于 一 些 对 中 断 
响应 时 间 有 严格 要 求 的 系统 ,这 是 必 不 可 少 的 。 

4C/OS 上 和 Linux 等 分 时 操作 系统 不 同 ,不 支持 时 间 片 轮转 法 。 它 是 一 个 基于 优先 级 
的 实时 操作 系统 。 每 一 个 任务 的 优先 级 必须 不 同 ,wC/OS 开 把 任务 的 优先 级 当做 任务 的 标 
识 来 使 用 ,如 果 优 先 级 相同 ,任务 将 无 法 区 分 。 进 入 就 绪 态 的 优先 级 最 高 的 任务 首先 得 到 
CPU 的 使 用 权 , 只 有 等 它 交 出 CPU 的 使 用 权 后 ,其 他 任务 才 可 以 被 执行 。 所 以 , 它 只 能 说 
是 多 任务 ,不 能 说 是 多 进程 。rC/OS 下 的 这 种 特性 如 何 , 主 要 看 从 什么 角度 来 判断 。 如 只 
考虑 实时 性 ,当然 比分 时 系统 好 , 它 可 以 保证 重要 任务 总 是 优先 占有 CPU。 但 是 ,在 系统 中 
重要 任务 毕竟 是 有 限 的 ,这 就 使 得 划分 其 他 任务 的 优先 权 变 成 了 一 个 困难 的 问题 。 另 外 ,有 
些 任务 交替 执行 反而 对 用 户 更 有 利 。 例 如 ,用 单片机 控制 两 小 块 显示 屏 时 ,无 论 是 编程 者 还 
是 使 用 者 肯定 希望 它们 同时 工作 ,而 不 是 显示 完 一 块 显示 屏 的 信息 以 后 ,再 显示 另 一 块 显示 
屏 的 信息 。 

4C/OS 开 对 共享 资源 提供 了 保护 机 制 。pC/OS 开 是 一 个 支持 多 任务 的 操作 系统 ,可 
以 把 一 个 完整 的 程序 划分 成 几 个 任务 ,不同 的 任务 执行 不 同 的 功能 。 对 于 共享 资源 (如 串 
口 ),pCVOS 开 也 提供 了 很 好 的 解决 办 法 ,一 般 情 况 下 使 用 的 是 信号 量 方法 。 创 建 一 个 信号 
量 并 对 它 进行 初始 化 , 当 一 个 任务 需要 使 用 一 个 共享 资源 时 , 它 必须 先 申请 得 到 这 个 信号 
量 。 在 这 个 过 程 中 ,即使 有 优先 权 更 高 的 任务 进入 了 就 绪 态 ,因为 无 法 得 到 信号 量 , 也 不 能 
使 用 该 资源 ,这 在 yC/OS 开 中 称 为 优先 级 反 转 。 简 单 地 说 ,就 是 高 优先 级 任务 必须 等 待 低 
优先 级 任务 的 完成 。 在 上 述 情况 下 ,两 个 任务 之 间 发 生 优 先 级 反 转 是 无 法 避免 的 ,所 以 在 使 
用 pC/OS 工时 ,必须 对 所 开发 的 系统 了 解 清楚 ,才能 决定 对 于 某 种 共享 资源 是 否 使 用 信 
号 量 。 

在 单片机 系统 中 嵌入 pyC/OS 下 将 增强 系统 的 可 靠 性 ,并 使 得 调试 程序 变 得 简单 。 编 完 
程序 后 ,在 调试 过 程 中 经 常会 出 现 程序 跑 飞 或 者 陷 和 人 死 循环 的 情况 ,如 果 在 系统 中 嵌入 pC/ 
OS 开 , 可 以 把 整个 程序 分 成 许多 任务 ,每 个 任务 相对 独立 ,然后 ,在 每 个 任务 中 设置 超时 函 
数 , 时 间 用 完 以 后 ,任务 必须 交 出 CPU 的 使 用 权 。 即 使 一 个 任务 发 生 问题 ,也 不 会 影响 其 
他 任务 的 运行 。 这 样 既 提 高 了 系统 的 可 靠 性 .同时 也 使 得 调试 程序 变 得 容易 。 

在 单片机 系统 中 嵌入 yC/OS 开 将 增加 系统 的 开销 ,现在 使 用 的 51 系列 单片机 ,其 片 内 
都 带 有 一 定 的 RAM 和 ROM。 对 于 一 些 简单 的 程序 ,如 果 采 用 传统 的 编程 方法 ,已 经 不 需 
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要 外 扩 存 储 器 了 。 如 果 在 其 中 嵌入 uC/OS ,在 只 需要 使 用 任务 调度 .任务 切换 、 信 号 量 
理 、 延 时 或 超时 服务 的 情况 下 ,也 不 需要 外 扩 ROM, 但 是 外 扩 RAM 是 必需 的 。 由 于 pC/ 
OS 开 是 可 裁剪 的 操作 系统 ,其 所 需要 的 RAM 的 大 小 就 依赖 于 对 操作 系统 的 一 些 选择 。 自 
入 pC/OS 本 后 ,总 的 RAM 需求 可 以 由 如 下 表达 式 得 出 : 

RAM 总 需求 王 应 用 程序 RAM 需求 十 (任务 栈 需 求 十 最 大 中 断 说 套 栈 需 求 )X 任 务 数 

如 果 内 核 支持 中 断 用 栈 分 离 , 则 总 的 RAM 需求 量 的 表达 式 为 

RAM 总 需求 = 应 用 程序 RAM 需求 十 内 核 数据 区 RAM 需求 十 各 任务 栈 需 求 的 总 和 十 
最 多 中 断 嵌 套 栈 需 求 

由 于 pC/OS 下 可 以 对 每 个 任务 分 别 定义 堆栈 空间 的 大 小 ,所 以 可 根据 任务 的 实时 需求 
来 进行 栈 空间 的 分 配 。 在 RAM 容量 有 限 的 情况 下 ,还 是 应 该 注意 对 大 型 数组 .数据 结构 和 
函数 的 使 用 ,函数 的 形 参 也 需要 推 人 堆栈 。 

对 于 pnC/OS 开 的 移植 ,如 果 手 中 没有 现成 的 移植 实例 ,就 必须 自己 来 编写 移植 代码 。 
虽然 只 需要 改动 两 个 文件 ,但 仍 需要 对 相应 的 微 处 理 器 比较 熟悉 才 行 ,最 好 参照 已 有 的 移植 
实例 。 另 外 ,即使 有 移植 实例 ,在 编程 前 最 好 也 要 阅读 一 下 ,因为 里 面 涉及 堆栈 操作 。 在 编 
写 中 断 服务 程序 时 ,把 寄存 器 推 入 堆栈 的 顺序 必须 与 移植 代码 中 的 顺序 相对 应 。 

和 其 他 一 些 著名 的 嵌入 式 操 作 系 统 不 同 ,nC/OS 本 在 单片机 系统 中 的 启动 过 程 比 较 简 
单 。pC/OS 开 的 内 核 和 应 用 程序 放 在 一 起 编译 成 一 个 文件 ,只 需要 把 这 个 文件 转换 成 
HEX 格式 , 写 人 ROM 中 就 可 以 了 。 上 电 后 , 它 会 像 普 通 的 单片机 程序 一 样 运行 。 


@.6 典 入 式 操作 系统 的 发 展 趋势 


未 来 嵌入 式 操作 系统 的 应 用 会 越 来 越 广泛 ,其 发 展 也 非常 迅速 ,主要 体现 在 以 下 几 个 
方面 。 

1. 开放 性 

商用 实时 、 艇 入 式 操 作 系统 为 了 支持 开发 商 根据 需要 自行 开发 所 需 的 应 用 程序 ,除了 提 
供 一 套 自身 的 API 以 外 ,正在 向 标准 化 看 齐 ,提供 包括 支持 POSIX ITRON 等 标准 的 API。 


特别 地 ,嵌入 式 Linux、Android 等 所 具有 的 开放 源 代 码 等 特性 很 好 地 适应 了 人 们 对 自由 软 
件 的 渴望 ,满足 了 嵌入 式 应 用 的 特性 对 系统 源 代码 的 需求 。 


2. 面向 特定 领域 


嵌入 式 应 用 千差万别 ,一 套 通用 的 RTOS 显然 无 法 适应 这 种 局 面 。 如 今 ,各 主要 厂商 
都 致力 于 开发 面向 特定 领域 的 RTOS 以 抢占 市 场 。 其 中 比较 有 特色 的 包括 手机 骨 入 式 操 
作 系 统 Symbian 以 及 欧洲 制定 的 汽车 电子 嵌入 式 操 作 系 统 标准 OSEK/VDX 等 。 


3. 面向 网 络 


网 络 化 已 成 为 全 球 趋 势 。 作 为 支持 嵌入 式 应 用 的 RTOS ,提供 丰富 的 网 络 支持 显得 十 
分 必要 。 由 于 嵌入 式 系统 的 特殊 性 ,不 但 要 考虑 支持 因特网 ,而 且 还 必须 考虑 支持 各 类 工业 
现场 网 络 、 无 线 网 络 等。 同时 随 着 云 计算 的 发 展 ,未 来 嵌入 式 操作 系统 需要 支持 云 平台 , 即 
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不 仅 要 管理 本 地 资源 ,还 要 能 够 分 配 和 管理 好 网 络 和 云端 资源 。 
4. 可 信 性 支持 


可 信 性 是 现代 计算 机 系统 特别 关注 的 特性 。 为 方便 应 用 开发 ,提高 用 户 透 明 性 ,在 
RTOS 中 提供 可 信保 障 是 必然 选择 。 其 中 , 除 传统 上 一 直 考 虑 的 可 靠 性 之 外 , 防 危 性 
(safety) 和 安全 性 (security) 越 来 越 受到 关注 。 前 者 强调 RTOS 在 安全 关键 系统 中 的 可 靠 
性 ,预防 系统 故障 导致 的 灾难 性 后 果 ; 后 者 主要 应 用 于 安全 保密 领域 ,例如 因特网 的 安全 路 
由 器、 防止 非法 用 户 访问 支持 IPSec 等 。 


5. 多 核 支持 


随 着 SoC 技术 的 不 断 发 展 以 及 嵌入 式 系统 复杂 度 的 提高 ,多 核 芯片 逐步 出 现 。 传 统 单 
核 处 理 器 及 RTOS 已 不 能 满足 应 用 的 需求 。 在 未 来 较 长 的 一 段 时 期 内 ,多 核 计 算 将 是 计算 
机 技术 、 嵌 入 式 实时 技术 的 一 个 重要 发 展 方向 。 操 作 系 统 作 为 运行 在 处 理 器 上 的 最 重要 的 
基础 软件 ,如 何 支持 多 核 化 成 为 一 个 研究 热点 。 首 先 ,如 何 把 顺序 程序 分 配给 多 核 来 处 理 成 
为 嵌入 式 操作 系统 的 首要 任务 ; 其 次 ,SoC 多 核 带 来 的 低 功 耗 问题 也 将 是 操作 系统 考虑 的 
重要 问题 ,在 某 个 核 没有 任务 时 ,系统 将 可 处 于 深度 睡眠 状态 ; 再 次 ,还 需要 提供 给 不 同 的 
核 一 个 抽象 层 , 继 承 对 一 些 原 有 操作 系统 的 支持 ; 最 后 , 当 系 统 变 得 庞大 时 ,还 必须 维护 系 
统 运行 的 高 可 靠 性 。 尽 管 目前 主流 的 操作 系统 已 提供 对 于 桌面 计算 机 多 核 处 理 器 的 支持 ， 
但 是 这 种 支持 还 很 初级 ,与 嵌入 式 实时 系统 对 多 核 支 持 的 要 求 相差 甚 远 。 此 外 ,尽管 一 些 商 
用 嵌入 式 实时 操作 系统 (例如 VxWorks、QNX 等 ) 提 供 了 多 核 支持 ,但 这 种 支持 并 不 能 很 好 
地 发 挥 多 核 处 理 器 的 性 能 和 优势 。 如 何 使 多 核 技术 在 嵌入 式 实时 计算 领域 得 到 有 效应 用 ， 
是 嵌入 式 操作 系统 的 重要 研究 课题 。 


习题 


1. 简 述 嵌入 式 操作 系统 的 发 展 史 。 

2. 简 述 RTOS 的 主要 特点 。 

3. 简 述 RTOS 的 应 用 场合 ,分 析 各 类 不 同 应 用 对 RTOS 的 不 同 要 求 ( 如 实时 性 、 高 可 
信和 性、 小 巧 性 等 ) 。 

4. 简 述 RTOS 的 发 展 趋势 。 
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随 着 计算 机 技术 和 通信 技术 的 迅速 发 展 , 人 类 社会 已 步 人 信息 化 时 代 。 信 息 社 会 给 我 
们 带 来 了 巨大 的 便利 ,同时 也 带 来 了 信息 安全 这 一 严峻 问题 。 操 作 系统 是 计算 机 系统 的 灵 
魂 , 是 对 计算 机 软件 和 硬件 资源 进行 管理 的 最 底层 的 系统 软件 。 现 代 操作 系统 支持 许多 程 
序 设计 概念 ,同时 也 限制 各 类 程序 的 行为 。 操 作 系 统 强 大 的 功能 使 得 它 常常 成 为 人 侵 者 的 
首要 目标 。 操 作 系 统 的 安全 性 成 为 计算 机 系统 、 网 络 系统 以 及 在 此 基础 上 建立 的 各 种 应 用 
系统 成 败 的 关键 。 

本 章 将 讨论 计算 机 操作 系统 的 安全 性 以 及 操作 系统 的 安全 机 制 。 


(0,1 操作 系统 安全 概述 


操作 系统 的 不 安全 主要 是 由 于 系统 设计 中 的 “破绽 ”所 引起 的 。 例 如 ,操作 系统 中 的 驱 
动 程序 和 系统 服务 通过 动态 链接 进行 打 “ 补 丁 ” 升 级 ,这 种 动态 链接 的 方式 容易 被 黑客 利用 ， 
这 种 环境 也 有 利于 计算 机 病毒 的 扩散 。 再 比如 ,操作 系统 的 隐蔽 通道 既 为 开发 人 员 提 供 了 
便捷 入 口 ,也 成 为 黑客 的 入 侵 通 道 。 操 作 系 统 的 进程 远程 创建 和 进程 继承 的 功能 提供 了 远 
端 服务 器 安装 “间谍 ”软件 的 条 件 。 下 面 列 出 了 威胁 操作 系统 安全 的 几 种 主要 因素 : 

(1) 网 络 攻击 破坏 系统 的 可 用 性 和 完整 性 。 

例如 ,恶意 代码 (病毒 .特洛伊 木马 ,蠕虫 等 ) 感 染 系 统 , 感 染 应 用 程序 或 数据 文件 ,造成 
程序 和 数据 文件 的 丢失 或 被 破坏 ,甚至 使 系统 瘫痪 或 崩 当 。 例 如 2017 年 5 月 13 日 全 球 爆 
发 的 "勒索 "病毒 ,不 法 分 子 使 用 NSA 泄露 的 “永恒 之 蓝 ” 黑 客 武器 攻击 Windows 的 445 端 
口 (文件 共享 ) ,使 ONION 、WNCRY 等 勒索 病毒 在 校园 网 快速 传播 感染 ,如 果 系 统 没 有 安 
装 2017 年 3 月 的 微软 补丁 ,无 须 用 户 进行 任何 操作 ,只 要 开机 上 网 ,“ 永 恒 之 蓝 ” 就 能 在 计算 
机 里 执行 任意 代码 , 植 人 勒索 病毒 等 恶意 程序 。 

(2) 隐 通 道破 坏 系 统 的 保密 性 和 完整 性 。 

隐 通 道 (covert channel) 是 指 系统 的 一 个 用 户 通过 违反 系统 安全 策略 的 方式 传送 信息 
给 另 一 用 户 的 机 制 。 它 通过 系统 原本 不 用 于 数据 传送 的 系统 资源 来 传送 信息 ,并 且 这 种 通 
信 方 式 往往 不 被 系统 的 存 取 控 制 机 制 所 检测 和 控制 。 操 作 系统 .数据 库 系统 .网络 、 分 布 式 
数据 库 管理 系统 中 都 可 能 存在 隐 通 道 。 

隐 通 道 可 以 分 为 存储 隐 通 道 和 定时 隐 通 道 。 如 果 一 个 隐 通 道 是 一 个 主体 直接 或 间接 地 
写 个 一 存储 位 置 而 被 另 一 主体 直接 或 间接 地 读 这 个 存储 位 置 时 ,这 个 隐 通 道 是 存储 隐 通 道 。 
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如 果 一 个 隐 通 道 是 一 个 主体 通过 调整 它 自己 的 系统 资源 (如 CPU 时 间 ) 的 使 用 时 间 而 影响 
另 一 个 主体 的 实际 的 响应 时 间 , 从 而 发 送信 息 给 另 一 主体 时 ,这 个 隐 通 道 是 定时 隐 通 道 。 

例如 ,磁盘 移 臂 隐 通 道 可 以 看 作 是 存储 隐 通 道 ,因为 发 送 进 程 修改 磁 臂 的 方向 ,接收 进 
程 能 够 观察 到 其 修改 的 结果 。 

打印 机 连接 隐 通 道 也 可 以 看 作 是 存储 隐 和 通道, 发 送 进程 使 打印 机 处 于 “ 忙 ”或 “空闲 " 状 
态 , 可 以 让 接收 进程 观察 到 。 

目录 结构 隐 通 道 也 可 看 作 存 储 隐 通道 ,发 送 进 程 创建 或 删除 目录 ,接收 进程 能 间接 观察 
到 该 目录 是 否 存在 。 

关于 CPU 使 用 的 隐 通 道 可 以 看 作 时 间 隐 通道 ,发 送 进 程 对 CPU 的 使 用 情况 可 以 被 另 
一 进程 观察 到 ,并 且 可 以 利用 时 钟 每 隔 一 定 的 时 间 片 进行 测量 。 

存储 隐 通 道 和 时 间 隐 通道 都 利用 共享 资源 来 传递 秘密 信息 ,并 且 要 协调 好 时 间 间 隔 。 
例如 磁盘 存储 ,服务 程序 为 了 表示 信息 1, 在 磁盘 上 创建 一 个 非常 大 的 文件 ,占用 了 磁盘 上 
的 大 部 分 可 用 空间 。 之 后 ,间谍 程序 也 会 尝试 在 磁盘 上 创建 一 个 大 型 文件 。 如 果 成 功 ,间谍 
程序 就 推断 服务 程序 没有 在 磁盘 上 创建 大 型 文件 ,所 以 服务 程序 提供 的 信息 为 0; 否则 ,该 
信息 就 是 1。 间 谍 程 序 只 需要 通过 判断 某 个 文件 是 否 存在 就 能 够 得 到 秘密 的 信息 。 

(3) 无 意 和 偶发 性 的 攻击 破坏 操作 系统 的 可 用 性 和 完整 性 。 

用 户 操 作 上 的 失误 ,计算 机 硬件 的 故障 ,其 他 软件 中 存在 的 潜在 漏洞 ,计算 机 运行 环境 
不 达标 以 及 突然 断 电 、 火 灾 等 自然 灾害 ,同样 会 给 操作 系统 安全 造成 非常 严重 的 后 果 。 例 
如 ,用 户 无 意 删 除了 系统 的 某 个 文件 或 无 意 停止 了 系统 的 正常 任务 ,这 些 都 会 影响 系统 的 稳 
定 运行 。 在 多 用 户 操作 系统 中 ,各 用 户 程序 执行 过 程 中 会 互相 干扰 ,从 而 产生 不 良 影 响 。 

由 于 上 述 种 种 原因 ,操作 系统 中 必然 存在 着 各 种 安全 隐患 ,一 个 有 效 、 可 靠 的 操作 系统 
必须 具有 相应 的 保护 措施 ,消除 或 限制 恶意 代码 、 网 络 攻击 、 隐 通道 . 误 操作 等 对 系统 造成 的 


(0,2 操作 系统 的 安全 机 制 


在 目前 复杂 的 网 络 开 放 环境 中 ,计算 机 病毒 和 恶意 程序 的 攻击 范围 扩大 ,传播 过 程 简 
化 ,系统 被 攻击 的 人 口 增 多 ,破坏 面 增 大 ,安全 问题 也 越 来 越 突出 。 在 一 个 开放 式 系统 中 ,如 
果 没 有 恰当 的 安全 控制 ,相当 于 为 入侵 者 打开 了 方便 之 门 。 计 算 机 系统 的 安全 又 极 大 地 取 
决 于 操作 系统 的 安全 ,如 果 操 作 系 统 本 身 的 安全 机 制 不 能 抵挡 入 侵 者 的 攻击 ,由 此 造成 的 损 
坏 和 范围 将 非常 严重 。 操 作 系 统 安全 的 主要 目标 如 下 : 

。 按 系统 安全 策略 对 用 户 的 操作 进行 访问 控制 ,防止 用 户 对 计算 机 资源 的 非法 使 用 

(包括 窃取 、 自 改 和 破坏 )。 

。 标识 系统 中 的 用 户 , 并 对 身份 进行 鉴别 。 

。 监督 系统 运行 的 安全 性 。 

。 保证 系统 自身 的 安全 性 和 完整 性 。 

实现 操作 系统 安全 目标 的 主要 安全 机 制 包括 : 

。 硬件 安全 机 制 。 

。 标识 与 鉴别 机 制 。 
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访问 控制 机 制 。 
。 最 小 权限 管理 。 
。 可 信 通 路 。 

。 安全 审计 机 制 。 


10.2.1 硬件 安全 机 制 


一 个 安全 的 操作 系统 必须 有 优秀 的 硬件 保护 性 能 。 计 算 机 硬件 安全 的 目标 是 保证 其 自 
身 的 可 靠 性 和 为 系统 提供 基本 安全 机 制 。 其 中 基本 安全 机 制 包括 存储 安全 、 运 行 安全 、1/O 
安全 等 。 


1. 存储 安全 


对 于 一 个 安全 的 操作 系统 来 说 ,存储 安全 是 最 基本 的 要 求 , 即 保护 用 户 存储 在 存储 器 中 
的 数据 。 保 护 单元 为 存储 器 中 的 最 小 数据 范围 ,可 为 字 、 字 块 、 页 面 或 段 。 保 护 单元 越 小 , 则 
存储 安全 精度 越 高 。 对 于 代表 单个 用 户 、 在 内 存 中 一 次 运行 一 个 进程 的 系统 ,存储 安全 机 制 
应 该 防止 用 户 程序 对 操作 系统 的 影响 。 在 多 道 程序 运行 的 系统 中 ,同样 需要 存储 安全 机 制 
对 进程 的 存储 区 域 实行 互相 隔离 。 存 储 安全 与 存储 器 管理 是 紧密 相连 的 ,存储 安全 保证 系 
统 各 个 任务 之 间 互 不 干扰 ; 存储 器 管理 则 是 为 了 更 有 效 地 利用 存储 空间 。 

前 面 介绍 过 虚拟 空间 和 有 段 的 概念 。 当 系统 的 地 址 空间 分 为 两 个 段 (系统 段 与 用 户 段 ) 
时 ,应 禁止 在 用 户 模 式 下 运行 的 非特 权 进 程 向 系统 段 进行 写 操作 ,而 当 在 系统 模式 下 运行 
时 , 则 允许 进程 对 所 有 的 虚 存 空间 进行 读 、 写 操作 。 用 户 模式 到 系统 模式 的 转换 应 由 一 个 特 
殊 的 指令 完成 ,该 指令 将 限制 进程 只 能 对 部 分 系统 空间 进行 访问 。 这 些 访问 控制 一 般 是 由 
硬件 根据 该 进程 的 特权 模式 实施 的 ,从 系统 灵活 性 的 角度 看 ,还 是 希望 由 系统 软件 精确 地 说 
明 该 进程 对 系统 空间 的 哪 一 页 是 可 读 的 , 哪 一 页 是 可 写 的 。 

在 计算 机 系统 提供 透明 的 存储 器 (内 存 ) 管 理 之 前 ,访问 判决 基于 物理 页 号 的 识别 。 每 
个 物理 页 号 都 被 标 以 一 个 称 为 密 钥 的 秘密 信息 ,系统 只 允许 拥有 该 密 钥 的 进程 访问 该 物理 
页 ,同时 利用 一 些 访问 控制 信息 指明 该 页 是 可 读 的 还 是 可 写 的 。 每 个 进程 相应 地 分 配 一 个 
密 钥 ,该 密 钥 由 操作 系统 装 和 人 进程 的 状态 字 中 。 每 次 执行 进程 访问 内 存 的 操作 时 ,由 硬件 对 
该 密 钥 进行 检验 ,只 有 当 进程 的 密 钥 与 内 存 物理 页 的 密 钥 相 匹配 ,并且 相应 的 访问 控制 信息 
与 该 物理 页 的 读 写 模式 相 匹配 时 , 才 允 许 该 进程 访问 该 页 内 存 , 和 否则 禁止 访问 。 

这 种 对 物理 页 附加 密 钥 的 方法 是 比较 烦琐 的 。 因 为 在 一 个 进程 生存 期 间 , 它 可 能 多 次 
受到 阻塞 而 被 挂 起 , 当 重 新 启动 被 挂 起 的 进程 时 , 它 占 有 的 全 部 物理 页 与 挂 起 前 所 占有 的 物 
理 页 不 一 定 相同 。 每 当 物 理 页 的 所 有 权 改 变 一 次 ,相应 的 访问 控制 信息 就 得 修改 一 次 。 并 
且 , 如 果 两 个 进程 共享 一 个 物理 页 ,但 一 个 用 于 读 而 另 一 个 用 于 写 ,那么 相应 的 访问 控制 信 
息 在 进程 转换 时 就 必须 修改 ,这 样 就 会 增加 系统 开销 ,影响 系统 性 能 。 

采用 基于 描述 符 的 地 址 解释 机 制 可 以 避免 上 述 管理 上 的 困难 。 在 这 种 方式 下 ,每 个 进 
程 都 有 一 个 “私有 的 地址 描述 符 ,进程 对 系统 内 存 某 页 或 某 段 的 访问 模式 都 在 该 描述 符 中 
说 明 。 可 以 有 两 类 访问 模式 集 , 一 类 用 于 在 用 户 状态 下 运行 的 进程 , 另 一 类 用 于 在 系统 模式 
下 运行 的 进程 。 此 处 ,W、R、E 各 占 一 位 ,用 来 指明 是 否 允 许 进程 对 内 存 的 某 页 或 某 段 进行 
写 , 读 和 运行 的 访问 操作 。 由 于 在 地 址 解释 期 间 , 地 址 描述 符 同时 也 被 系统 调用 检验 ,所 以 
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这 种 基于 描述 符 的 内 存 访问 控制 方法 在 进程 转换 、 运 行 模式 (系统 模式 与 用 户 模式 ) 转 换 以 
及 进程 调 出 / 调 入 内 存 等 过 程 中 不 需要 或 仅 需 要 很 少 的 额外 开销 。 


2. 运行 安全 


安全 的 操作 系统 很 重要 的 一 点 是 进行 分 层 设 计 ,而 运行 域 正 是 这 样 一 种 基于 保护 环 
(protectionring) 的 等 级 式 结构 。 运 行 域 是 进程 运行 的 区 
域 ,最 内 层 具有 最 小 环 号 的 环 具 有 最 高 特权 ,而 最 外 层 具 R7 受 限 用 户 


有 最 大 环 号 的 环 具有 最 低 的 特权 。 一 般 的 系统 为 三 四 个 | / R6 受 限 用 户 X 
环 甚至 更 多 。 


多 环 结构 的 最 内 层 是 操作 系统 , 它 控制 整个 计算 机 系 
统 的 运行 ; 中 间 的 层 是 受 限 使 用 的 系统 应 用 环 , 如 数据 库 R4 用 户 程序 
管理 系统 或 事务 处 理 系 统 ; 靠 外 的 层 则 是 控制 各 种 不 同 R3 系 统 应 用 程序 
用 户 的 应 用 环 ,如 图 10-1 所 示 。 

在 这 里 ,等 级 域 机 制 应 该 保护 某 一 环 不 被 其 外 层 环 侵 
入 ,并 且 允 许 在 某 一 环 内 的 进程 能 够 有 效 地 控制 与 利用 该 
环 以 及 特权 低 于 该 环 的 环 。 进 程 隔离 机 制 与 等 级 域 机 制 
是 互 不 相关 的 。 给 定 一 个 进程 , 它 可 以 在 任意 时 刻 在 任何 
一 个 环 内 运行 ,在 运行 期 间 还 可 以 从 一 个 环 转移 到 另 一 个 
环 。 当 一 个 进程 在 某 个 环 内 运行 时 ,进程 隔离 机 制 将 保护 
该 进程 免 遭 在 同一 环 内 同时 运行 的 其 他 进程 破坏 ,也 就 是 
说 ,系统 将 隔离 在 同一 环 内 同时 运行 的 各 个 进程 。 

为 了 实现 两 级 域 结构 ,在 段 描述 符 中 相应 地 有 两 类 访问 模式 信息 ,一 类 用 于 系统 域 , 另 
一 类 用 于 用 户 域 ,这 些 访问 模式 信息 决定 了 对 该 段 可 进行 的 访问 模式 ,如 图 10-2 所 示 。 

如 果 要 实现 多 级 域 ,就 需要 在 每 个 段 描述 符 中 保存 一 个 分 立 的 W、R.E 位 集 ,位 集 的 大 
小 将 取决 于 设立 多 少 个 等 级 。 这 在 管理 上 是 很 笨拙 的 ,可 以 根据 等 级 原则 简化 段 描述 符 。 
如 果 环 N 对 某 一 段 具 有 一 个 给 定 的 访问 模式 ,那么 所 有 0~N 一 1 的 环 都 具有 这 种 访问 模 
式 ,因此 对 于 每 种 访问 模式 , 仅 需 要 在 该 描述 符 中 指出 具有 该 访问 模式 的 最 大 环 号 ,而 不 必 
为 每 个 环 都 保存 相应 的 访问 模式 信息 。 对 于 一 个 给 定 的 内 存 段 , 仅 需 3 个 区 域 (它们 表示 
3 种 访问 模式 ) ,在 这 3 个 区 域 中 ,只 要 保存 具有 该 访问 模式 的 最 大 环 号 即 可 ,如 图 10-3 
所 示 。 
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图 10-2 两 级 域 结构 中 的 段 描述 符 图 10-3 多 级 域 结构 中 的 段 描述 符 


我 们 称 这 3 个 环 号 为 环 界 (ring bracket)。 相 应 地 ,这 里 Ri 、R;、R; 分 别 表示 对 该 段 可 
以 进行 写 、 读 ,运行 操作 的 环 界 。 

例如 ,在 某 个 段 描述 符 中 , 环 界 集 (4,5,7) 表 示 可 对 0 一 4 环 进行 写 操作 ,可 对 0 一 5 环 进 
行 读 操 作 , 可 运行 0 一 7 环 的 代码 。 


第 10 章 ”操作 系统 安全 


实际 上 ,如 果 某 环 内 的 某 一 进程 对 内 存 某 自 具有 写 操 作 的 特权 ,就 不 必 限 制 其 对 该 段 的 
读 与 运行 操作 特权 。 此 外 ,如 果 进 程 对 某 段 具有 读 操作 的 特权 , 那 当然 允许 其 运行 该 段 的 内 
容 。 所 以 ,实际 上 总 可 以 设 定 

RR 

如 果 某 段 对 具有 较 低 特权 的 环 是 可 写 的 ,那么 在 较 高 特权 环 内 运行 该 段 的 内 容 将 是 危 
险 的 ,因为 该 段 内 容 中 可 能 含有 破坏 系统 运行 或 偷窃 系统 机 密 信息 的 非法 程序 (如 特洛伊 木 
马 ) 。 所 以 ,从 安全 性 的 角度 考虑 ,不 允许 低 特权 环 内 编写 (修改 ?的 程序 在 高 特权 环 内 运行 。 

环 界 集 为 (0,0,0) 的 段 只 允许 最 内 层 环 ( 具 最 高 特权 ) 访 问 , 而 环 界 集 为 (7,7,7) 则 表示 
任何 环 都 可 以 对 该 段 进 行 任何 形式 的 访问 操作 。 由 于 0 环 是 最 高 特权 环 ,所 以 一 般 不 限制 
0 环 内 的 用 户 对 段 的 访问 模式 。 

对 于 一 个 给 定 的 段 ,每 个 进程 都 有 一 个 相应 的 段 描述 符 表 以 及 相应 的 访问 模式 信息 。 
利用 环 界 集 最 直观 和 最 简单 的 方法 是 ,对 于 一 个 给 定 的 段 ,为 每 个 进程 分 配 一 个 相应 的 环 界 
集 , 不 同 的 进程 对 该 段 的 环 界 可 能 是 不 同 的 。 当 两 个 进程 共享 某 一 段 时 ,车 这 两 个 进程 在 同 
一 环 内 ,那么 对 该 段 的 环 界 集 就 是 相同 的 ,所 以 它们 对 共享 段 的 访问 模式 也 是 相同 的 。 反 
之 ,处 于 两 个 不 同 环 内 的 进程 对 某 段 的 访问 模式 可 能 是 不 同 的 。 这 种 方法 不 能 解决 在 同一 
环 内 的 两 个 进程 对 共享 段 设立 不 同 访问 模式 的 问题 。 有 一 个 解决 的 方法 是 ,将 段 的 环 界 集 
定义 为 系统 属性 , 它 只 说 明 某 环 内 的 进程 对 该 段 具 有 什么 样 的 访问 模式 , 即 哪 个 环 内 的 进程 
可 以 访问 该 段 以 及 可 以 进行 何 种 模式 的 访问 ,而 不 考虑 究竟 是 哪个 进程 访问 该 段 。 所 以 ,对 
一 个 给 定 的 段 ,不 是 为 每 个 进程 都 分 配 一 个 相应 的 环 界 集 ( 由 于 一 个 进程 可 以 在 不 同 的 环 内 
运行 ,所 以 一 个 进程 对 一 个 段 的 环 界 集 可 能 是 不 同 的 ) ,而 是 为 所 有 进程 都 分 配 一 个 相同 的 
环 界 集 。 同 时 ,在 段 描述 符 中 再 增加 3 个 访问 模式 位 W、R、E。 

不 同 的 进程 有 不 同 的 访问 模式 位 。 这 时 对 一 个 给 定 段 的 访问 条 件 是 , 仅 当 一 个 进程 在 
环 界 集 限定 的 环 内 运行 且 相应 的 访问 模式 位 是 ON ,那么 才 允 许 该 进程 对 该 段 进 行 相应 的 
访问 操作 。 每 个 进程 的 段 描述 表 中 的 段 描述 符 都 包含 上 述 两 类 信息 。 环 界 集 对 所 有 进程 都 
是 相同 的 ,而 对 不 同 的 进程 可 设置 不 同 的 访问 模式 集 。 这 样 ,在 同一 环 内 运行 的 两 个 进程 共 
享 某 个 段 , 且 要 使 一 个 进程 只 对 该 段 进 行 读 访问 ,而 男 一 个 进程 只 对 该 段 进 行 写 访 问 时 ,只 
要 按 需 设置 两 个 进程 相应 的 访问 模式 信息 即 可 ,而 它们 的 环 界 集 则 是 相同 的 。 

在 一 个 进程 内 往往 会 发 生 过 程 调用 ,通过 这 些 调用 ,该 进程 可 以 在 几 个 环 内 往复 转移 。 
为 安全 起 见 , 在 发 生 过 程 调用 时 需要 对 过 程 进行 检验 。 


3. MO 安全 


在 一 个 操作 系统 的 所 有 功能 中 ,输入 输出 一 般 是 最 复杂 的 ,人 们 往往 首先 从 系统 的 输入 
输出 部 分 寻找 操作 系统 安全 方面 的 缺陷 。 绝 大 多 数 情 况 下 ,输入 输出 是 仅 由 操作 系统 完成 
的 一 个 特权 操作 ,所 有 操作 系统 都 对 读 写 文件 操作 提供 一 个 相应 的 高 层 系 统 调用 ,在 这 些 过 
程 中 ,用 户 不 需要 控制 输入 输出 操作 的 细节 。 

输入 与 介质 输出 访问 控制 最 简单 的 方式 是 将 设备 看 作 一 个 客体 ,仿佛 它们 都 处 于 安全 
防线 外 。 由 于 所 有 的 输入 输出 不 是 向 设备 写 数据 就 是 从 设备 接收 数据 ,所 以 一 个 进行 输入 
输出 操作 的 进程 必须 受到 对 设备 的 读 、 写 两 种 访问 控制 。 这 就 意味 着 设备 到 介质 间 的 路 径 
可 以 不 受 什么 约束 ,而 处 理 器 到 设备 间 的 路 径 则 需要 施 以 一 定 的 读 写 访问 控制 。 
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但 是 ,车 对 系统 中 的 信息 提供 足够 的 保护 ,防止 被 未 授权 用 户 的 滥用 或 毁坏 ,只 靠 硬件 
不 能 提供 充分 的 保护 手段 ,必须 由 操作 系统 的 安全 机 制 与 适当 的 硬件 相 结合 才能 提供 强 有 
力 的 保护 。 


10.2.2 标识 与 鉴别 机 制 


标识 (identification) 就 是 系统 要 标识 用 户 的 身份 ,并 为 每 个 用 户 取 一 个 内 部 名 称 一 一 
用 户 标 识 符 , 用 户 标 识 符 必须 是 唯一 的 且 不 能 被 伪造 。 将 用 户 标 识 符 与 用 户 联 系 的 过 程 称 
为 鉴别 (authentication) ,鉴别 过 程 主要 用 以 识别 用 户 的 真实 身份 ,要 求 用 户 具 有 能 够 证 明 
其 身份 的 特殊 信息 。 一 般 情况 下 ,可 以 通过 多 个 因素 来 共同 鉴别 用 户 身 份 的 真 伪 。 常 用 的 
方法 包括 : 

。 基于 密码 的 身份 验证 。 

。 基于 令 牌 的 身份 验证 。 

。 生物 特征 识别 认证 。 


1. 基于 密码 的 身份 验证 


密码 系统 是 针对 入 侵 者 的 一 种 广泛 使 用 的 防线 。 几 乎 所 有 的 多 用 户 系统 、 基 于 网 络 的 
服务 器 .基于 Web 的 电子 商务 网 站 和 其 他 类 似 服务 ,都 需要 用 户 不 仅 提供 名 称 或 标识 符 
(ID) ,还 需要 提供 密码 。 系 统 将 密码 与 先前 存储 在 一 个 系统 密码 文件 中 的 此 用 户 ID 的 密 
码 进行 比较 。 密 码 用 于 验证 登录 到 系统 的 个 人 的 ID。 

散 列 密码 和 盐 值 (salt value) 是 一 项 广泛 使 用 的 密码 安全 技术 。 此 方法 建立 在 几乎 所 
有 UNIX 变 体 及 许多 其 他 操作 系统 上 。 

如 图 10-4(a) 所 示 , 当 需要 将 新 密码 加 载 到 系统 中 时 ,用 户 选 择 一 个 密码 或 被 分 配 一 个 
密码 。 此 密码 与 固定 长 度 的 盐 值 组 合 使 用 。 盐 值 可 以 使 用 伪 随 机 数 或 者 随机 数 实现 。 密 码 
和 盐 值 充 当 散 列 算法 的 输入 来 生成 固定 长 度 的 散 列 码 。 散 列 算法 被 设计 为 执行 得 很 慢 , 从 
而 阻止 攻击 。 散 列 密码 连同 盐 值 的 明文 副本 被 存储 在 相应 用 户 的 密码 文件 中 。 

如 图 10-4(b) 所 示 , 当 用 户 尝 试 登录 UNIX 系统 时 ,用 户 提供 ID 和 密码 。 操 作 系统 使 
用 ID 来 索引 密码 文件 并 检索 明文 盐 值 和 加 密 密 码 。 盐 值 和 用 户 提 供 的 密码 用 做 加 密 例 程 
的 输入 。 如 果 结 果 与 存储 值 相 匹 配 , 则 接受 密码 。 

盐 的 作用 如 下 : 

(1) 防止 重复 的 密码 在 密码 文件 中 可 见 。 即 使 两 个 用 户 选择 相同 的 密码 ,这 些 密 码 将 
分 配 不 同 的 盐 值 ,从 而 使 得 两 个 用 户 的 散 列 密码 不 相同 。 

(2) 极 大 地 增加 了 离线 字典 攻击 的 难度 。 对 于 一 个 5 位 长 度 的 盐 值 ,可 能 的 密码 数 按 
2 的 系数 增长 ,从 而 增加 了 字典 攻击 猜测 密码 的 难度 。 

(3) 当 一 个 人 在 两 个 或 多 个 系统 上 具有 和 密码 时 ,不 可 能 查 明 其 是 否 在 所 有 系统 上 使 用 
了 相同 的 密码 。 

但 此 种 方案 也 有 两 个 问题 : 

(1) 用 户 可 以 使 用 来 宾 账 户 或 其 他 方法 获取 对 机 器 的 访问 ,然后 在 此 机 器 上 运行 密 
码 猜测 程序 (密码 破译 器 ) 。 攻 击 者 应 该 能 够 检查 上 千 个 可 能 的 密码 ,而 只 需 少 量 的 资源 
消耗 。 
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(2) 如 果 一 个 对 手 能 够 获取 密码 文件 的 副本 , 则 破解 器 程序 可 以 自由 运行 在 其 他 机 器 
上 。 这 使 得 对 手 可 以 以 合理 的 周期 运行 数 百 万 个 可 能 的 密码 。 
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2. 基于 令 牌 的 身份 验证 


用 户 使 用 自身 拥有 的 一 个 对 象 来 验证 自己 的 身份 ,这 一 对 象 称 为 令 牌 。 下 面 介绍 两 种 
不 同类 型 的 令 牌 。 它 们 的 大 小 和 外 形 与 银行 卡 相似 。 

1) 记忆 卡 

记忆 卡 可 以 存储 数据 ,但 不 能 处 理 数据 。 在 记忆 卡 的 背面 都 有 一 个 磁 条 ,这 个 磁 条 可 以 
存储 简单 的 安全 代码 ,并 能 够 被 卡 阅读 器 读 取 。 也 有 些 记忆 卡 的 内 部 使 用 的 是 电子 记忆 体 。 
记忆 卡 还 可 以 用 于 物理 访问 ,如 宾馆 的 房 卡 。 用 于 计算 机 用 户 身份 验证 时 ,这 种 卡通 常 使 用 
某 种 形式 的 密码 或 个 人 识别 码 (PIN) 。 一 个 典型 的 应 用 就 是 自动 提 款 机 (ATMD 。 

记忆 卡 加 上 密码 或 PIN , 比 单独 的 密码 安全 性 更 高 。 其 他 人 必须 得 到 记忆 卡 并 知道 卡 
的 密码 才 可 以 。 但 记忆 卡 存在 一 些 问题 : 

(1) 需要 特殊 的 读 卡 器 。 增 加 了 用 卡 成 本 ,并 要 求 读 卡 器 硬件 和 软件 的 安全 性 。 

(2) 记忆 卡 丢 失 。 重 新 制作 会 需要 额外 的 成 本 ,如 果 记 忆 卡 被 盗 , 盗 窍 者 只 需 知 道 密码 
就 可 以 访问 。 

(3) 用 户 不 满意 。 用 户 认为 使 用 计算 机 访问 不 够 便利 。 
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2) 智能 卡 

智能 卡 是 用 于 用 户 与 计算 机 身份 验证 的 最 重要 的 一 类 智能 令 牌 , 它 具 有 信用 卡 的 外 观 
和 电子 化 的 界面 ,可 以 使 用 任何 类 型 的 协议 。 智 能 卡 中 包含 一 个 完整 的 微 处 理 器 ,包括 处 理 
器 、 内 存 和 I/O 端口 , 某 些 版 本 采用 特殊 的 协 处 理 电 路 来 进行 加 密 操作 ,从 而 加 快 了 编码 和 
译 码 的 速度 ,或 者 生成 数字 签名 来 验证 信息 的 发 送 。 在 某 些 智能 卡 中 ,1/O 端口 可 以 与 兼容 
读 卡 器 直接 连接 ,还 有 一 些 智能 卡 依赖 于 一 个 嵌入 式 的 无 线 天 线 与 读 卡 器 交互 。 智 能 卡 可 
以 被 分 为 3 个 独立 的 维度 : 

(1) 物理 特性 。 智 能 令 牌 包括 一 个 谋 入 式 的 微 处 理 器 ,看 起 来 像 银 行 卡 的 智能 令 牌 称 
为 智能 卡 , 也 有 些 智能 卡 看 起 来 像 计 算 器 \ 钥 匙 或 小 型 便携 设备 。 

(2) 界面 。 包 括 一 个 按键 区 和 一 个 使 用 者 交互 区 ,智能 令 牌 通过 一 个 电子 接口 与 兼容 
的 读 / 写 卡 器 进行 交互 。 

(3) 验证 协议 。 智 能 令 牌 的 目的 是 提供 一 种 用 户 验证 的 方式 。 验 证 协议 在 智能 令 牌 上 
的 用 法 分 为 3 类 : 

O 静态 协议 。 通 过 静态 协议 ,用 户 通过 令 牌 验证 自己 的 身份 , 令 牌 通过 计算 机 验证 用 
户 的 身份 ,后 半 个 协议 类 似 于 记忆 卡 的 操作 。 

@ 动态 密码 发 生 器 。 在 这 种 情况 下 , 令 牌 周期 性 地 产生 一 个 唯一 的 密码 (例如 每 分 钟 
产生 一 个 ) ,这 个 密码 进入 计算 机 系统 用 于 验证 身份 ,无 论 是 用 户 手工 输入 还 是 经 过 令 牌 自 
动 生成 , 令 牌 和 计算 机 系统 都 必须 初始 化 并 保持 同步 ,以 便 计 算 机 知道 当前 令 牌 产生 的 
密码 。 

@ 询问 -应 答 。 在 这 种 情况 下 ,计算 机 系统 产生 一 个 问题 ,例如 随机 的 一 个 字符 串 或 者 
数字 ,智能 令 牌 产生 一 个 基于 这 个 问题 的 应 答 ,例如 使 用 公共 密 钥 密 码 系统 , 令 牌 能 够 通过 
自身 的 私人 密 钥 对 问题 进行 加 密 。 


3. 基于 生物 特征 识别 的 身份 认证 





密码 认证 方式 和 令 牌 认证 方式 虽然 使 用 广泛 ,但 是 有 许多 缺点 。 密 码 有 可 能 遭 到 破解 ， 
令 牌 需要 随身 携带 , 且 容易 丢失 或 者 被 盗窃。 直到 生物 识别 技术 得 到 成 功 应 用 ,身份 认证 机 
制 才 回 归 到 了 对 人 类 最 原始 特性 的 鉴别 上 。 基 于 生物 特征 的 认证 技术 具有 传统 的 身份 认证 
手段 无 法 比拟 的 优点 ,采用 生物 鉴别 技术 (Biometrics) ,可 不 必 再 记忆 和 设置 密码 ,使 用 更 
加 方便 。 生 物 特征 鉴别 技术 已 经 成 为 一 种 公认 的 最 安全 和 最 有 效 的 身份 认证 技术 ,但 同时 
也 具有 技术 复杂 性 和 成 本 高 昂 性 。 该 技术 将 成 为 IT 产业 最 重要 的 技术 革命 。 

生物 特征 认证 可 以 分 为 生理 特征 认证 和 生物 行为 认证 ,就 是 利用 人 体 固有 的 生理 特征 
或 行为 动作 来 进行 身份 识别 或 验证 。 这 里 的 生物 特征 通常 具有 唯一 性 、 可 以 测量 或 可 以 自 
动 识别 和 验证 、 遗 传 性 或 终身 不 变 等 特点 。 研 究 表 明 , 人 的 生理 特征 ,如 指纹 、 掌 纹 、 面 孔 、 发 
音 、 虹 膜 .视网膜 .骨架 等 都 具有 唯一 性 和 稳定 性 。 人 的 行为 特征 ,如 语音 语调 、 书 写 习惯 , 肢 
体 运动 .表情 行为 等 也 都 具有 一 定 的 稳定 性 和 难以 复制 性 。 生 物 识 别 的 核心 在 于 如 何 获取 
这 些 生物 特征 ,并 将 之 转换 为 数字 信息 ,存储 于 计算 机 中 ,利用 可 靠 的 匹配 算法 来 完成 个 人 
身份 验证 与 识别 。 

基于 生物 特征 识别 的 身份 认证 的 缺点 是 : 每 次 鉴别 产生 的 样本 可 能 有 所 不 同 。 因 为 用 
户 的 物理 特征 可 能 因为 某 些 原 因而 改变 。 例 如 在 获取 用 户 指纹 时 ,手指 由 于 变 脏 、 被 制 破 或 
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手指 放 在 阅读 器 上 的 位 置 不 同等 原因 而 无 法 正确 识别 。 

在 高 安全 等 级 需求 的 应 用 中 ,最 好 将 基于 生物 特征 的 身份 认证 机 制 和 其 他 用 户 认证 机 
制 结合 起 来 使 用 ,形成 三 因子 鉴别 机 制 ,例如 密码 十 智能 卡 十 指纹 ,或 者 口令 十 U 盾 十 签 
字 , 以 满足 用 户 更 高 的 安全 需求 。 


10.2.3 访问 控制 机 制 


访问 控制 技术 起 源 于 20 世纪 70 年 代 , 当 时 是 为 了 满足 管理 大 型 主机 系统 上 共享 数据 
授权 访问 的 需要 。 随 着 计算 机 技术 和 网 络 技术 的 发 展 ,先后 出 现 了 多 种 重要 的 访问 控制 技 
术 ,访问 控制 技术 在 信息 系统 的 各 个 领域 得 到 了 越 来 越 广泛 的 应 用 。 它 们 的 基本 目标 都 是 
防止 非法 用 户 进入 系统 和 合法 用 户 对 系统 资源 的 非法 使 用 。 访 问 控制 常 以 用 户 身份 认证 为 
前 提 , 在 此 基础 上 实施 各 种 访问 控制 策略 来 控制 和 规范 合法 用 户 在 系统 中 的 行为 。 

如 果 说 用 户 标识 与 鉴别 机 制 解决 的 是 “你 是 谁 ? 你 宣称 的 身份 是 否 真实 ?” 的 问题 ,访问 
控制 技术 解决 的 就 是 “你 能 做 什么 ? 你 有 什么 样 的 权限 ?” 的 问题 。 

访问 控制 策略 一 般 分 为 以 下 几 类 : 

。 自主 访问 控制 。 

。 强制 访问 控制 。 

。 基于 角色 的 访问 控制 。 

自主 访问 控制 是 实现 访问 控制 的 传统 方法 ,强制 访问 控制 是 从 军事 信息 安全 中 演化 出 
来 的 一 个 概念 ,基于 角色 的 访问 控制 则 成 为 越 来 越 受 欢迎 的 一 种 方式 。 


1. 自主 访问 控制 





自主 访问 控制 ( Discretionary Access Control,DAC) 是 最 常用 的 一 类 访问 控制 机 制 , 用 
来 决定 一 个 用 户 是 否 有 权 访 问 一 些 特定 客体 。 在 自主 访问 控制 机 制 下 ,文件 的 拥有 者 可 以 
按照 自己 的 意愿 精确 指定 系统 中 的 其 他 用 户 对 其 文件 的 访问 权 。 亦 即使 用 自主 访问 控制 机 
制 ,一 个 用 户 可 以 自主 地 说 明 他 所 拥有 的 资源 允许 系统 中 哪些 用 户 以 何 种 权限 进行 共享 。 
从 这 个 意义 上 讲 , 它 是 “自主 的。 另外 ,自主 也 指 对 其 他 具有 授予 某 种 访问 权限 的 用 户 能 够 
自主 地 (可 能 是 间接 的 ?将 访问 权限 或 访问 权限 的 某 个 子 集 授予 另外 的 用 户 。 

需要 自主 访问 控制 保护 的 客体 的 数量 取决 于 系统 环境 ,几乎 所 有 的 系统 在 自主 访问 控 
制 机 制 中 都 包括 对 文件 目录、IPC 以 及 设备 的 访问 控制 。 

为 了 实现 完备 的 自主 访问 控制 机 制 ,系统 要 将 访问 控制 矩阵 相应 的 信息 以 某 种 形式 保 
存在 系统 中 。 访 问 控制 矩阵 的 每 一 行 表示 一 个 主体 ,每 一 列表 示 一 个 受 保护 的 客体 ,矩阵 中 
的 元 素 表 示 主 体 对 客体 的 访问 模式 。 目 前 在 操作 系统 中 实现 的 自主 访问 控制 机 制 都 不 是 将 
矩阵 整个 保存 起 来 ,因为 这 样 做 效率 很 低 。 实 际 的 方法 是 基于 于 矩阵 的 行 或 列表 达 访问 控 
制 信息 。 

1) 基于 行 的 自主 访问 控制 机 制 

基于 行 的 自主 访问 控制 机 制 在 每 个 主体 上 都 附加 一 个 该 主体 可 访问 的 客体 的 明细 表 ， 
根据 表 中 信息 的 不 同 又 可 分 成 3 种 形式 , 即 能 力 表 、 配 置 表 和 口令 。 

(1) 能 力 表 (capabilities list) 。 能 力 决定 用 户 是 否 可 以 对 客体 进行 访问 以 及 进行 何 种 
模式 的 访问 ( 读 、 写 ,执行 ) ,拥有 相应 能 力 的 主体 可 以 按照 给 定 的 模式 访问 客体 。 在 系统 的 
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最 高 屋 上 , 即 与 用 户 和 文件 相 联 系 的 位 置 , 对 于 每 个 用 户 ,系统 有 一 个 能 力 表 。 要 采用 硬件 、 
软件 或 加 密 技术 对 系统 的 能 力 表 进 行 保护 ,防止 非法 修改 。 用 户 可 以 把 自己 的 文件 能 力 表 
的 副本 传 给 其 他 用 户 , 从 而 使 别 的 用 户 也 可 以 访问 相应 的 文件 ; 也 可 以 从 其 他 用 户 那 里 取 
回 能 力 , 从 而 恢复 对 自己 文件 的 访问 权限 。 采 用 这 种 访问 控制 方法 时 ,系统 要 维护 每 个 用 户 
状态 的 一 个 表 , 该 表 保 留成 千 上 万 条 目 。 当 一 个 文件 被 删除 以 后 ,系统 必须 从 每 个 用 户 的 表 
上 清除 那个 文件 相应 的 能 力 。 即 使 一 个 简单 的 “ 谁 能 访问 该 文件 ?” 的 问题 ,也 要 花费 系统 大 
量 时 间 从 每 个 用 户 的 能 力 表 中 寻找 。 因 此 ,目前 利用 能 力 表 实 现 的 自主 访问 控制 系统 不 多 ， 
并 且 在 这 些 为 数 不 多 的 系统 中 ,只 有 少数 系统 试图 实现 完备 的 自主 访问 控制 机 制 。 

(2) 配置 表 (profiles)。 对 每 个 主体 赋予 的 配置 表 , 包 括 受 保护 客体 名 和 主体 对 它 的 访 
问 权 限 。 当 主体 要 访问 某 客体 时 ,自主 访问 控制 机 制 将 检查 主体 的 配置 是 否 具 有 它 所 请 求 
的 访问 权 。 作 为 一 般 的 安全 规则 ,除非 主体 被 授予 某 种 访问 模式 ,否则 任何 主体 对 任何 客体 
都 不 具有 任何 访问 权限 。 用 专门 的 安全 管理 员 控 制 主体 配置 相对 而 言 是 比较 安全 的 ,但 这 
种 方法 非常 受 限 。 在 一 个 对 客体 的 访问 权 频 繁 更 迭 的 环境 下 ,这 种 方法 肯定 是 不 适宜 的 。 
因为 访问 权限 的 撤销 一 般 也 是 比较 困难 的 ,除非 对 每 种 访问 权限 ,系统 都 能 自动 校 验 主体 的 
配置 。 而 删除 一 个 客体 则 需要 判定 在 哪个 主体 配置 中 有 该 客体 。 另 外 ,客体 名 由 于 通常 是 
杂乱 无 章 的 ,所 以 很 难 分 类 。 对 于 一 个 可 访问 许多 客体 的 主体 , 它 的 配置 量 将 是 非常 大 的 ， 
因而 是 很 难 管理 的 。 此 外 ,所 有 受 保护 的 客体 都 必须 具有 唯一 的 客体 名 ,互相 不 能 重 名 ,而 
在 一 个 客体 很 多 的 系统 中 ,应 用 这 种 方法 就 十 分 困难 。 

(3) 口令 (password)。 在 基于 口令 的 自主 访问 控制 机 制 中 ,每 个 客体 都 相应 地 有 一 个 
口令 。 主 体 在 对 客体 进行 访问 前 ,必须 向 操作 系统 提供 该 客体 的 口令 。 如 果 正 确 , 它 就 可 以 
访问 该 客体 。 

如 果 对 每 个 客体 ,每 个 主体 都 拥有 它 自己 独 有 的 口令 , 则 类 似 于 能 力 表 系统 。 不 同 之 处 
在 于 ,口令 不 像 能 力 那 样 是 动态 的 。 系 统一 般 允 许 对 每 个 客体 分 配 一 个 口令 或 者 对 每 个 客 
体 的 每 种 访问 模式 分 配 一 个 口令 。 一 般 来 说 ,一 个 客体 至 少 需 要 两 个 口令 ,一 个 用 于 控制 
读 , 另 一 个 用 于 控制 写 。 对 于 口令 的 分 配 , 有 些 系统 是 只 有 系统 管理 员 才 有 权力 进行 ,而 另 
外 一 些 系统 则 允许 客体 的 拥有 者 任意 地 改变 客体 的 口令 。 

口令 机 制 对 于 确认 用 户 身 份 也 许 是 一 种 比较 有 效 的 方法 ,但 用 于 客体 访问 控制 , 它 并 不 
是 一 种 合适 的 方法 。 因 为 如 果 要 撤销 某 用 户 对 一 个 客体 的 访问 权 , 只 有 改变 该 客体 的 口令 
才 行 ,这 同时 也 意味 着 废除 了 所 有 其 他 可 访问 该 客体 的 用 户 的 访问 权限 。 当 然 可 以 对 每 个 
客体 使 用 多 个 口令 来 解决 这 个 问题 ,但 每 个 用 户 必 须 记 住 许多 不 同 的 口令 , 当 客体 很 多 时 ， 
用 户 就 不 得 不 将 这 些 口令 记录 下 来 才 不 至 于 混淆 或 遗忘 ,这 种 管理 方式 很 麻烦 ,也 不 安全 。 
另外 ,口令 是 手工 分 发 的 ,无 须 系统 参与 ,所 以 系统 不 知道 究 竞 是 哪个 用 户 访问 了 该 客体 ,并 
且 当 一 个 程序 运行 期 间 要 访问 某 个 客体 时 ,该 客体 的 口令 就 必须 嵌入 程序 中 ,这 就 大 大 增加 
了 口令 意外 泄露 的 危险 。 因 为 其 他 用 户 完全 不 必 知 道 某 客体 的 口令 ,只 需 运 行 一 段 垦 入 该 
客体 口令 的 程序 就 可 以 访问 到 该 客体 了 。 这 同样 给 这 种 机 制 带 来 了 不 安全 性 。 

2) 基于 列 的 自主 访问 控制 机 制 

基于 列 的 自主 访问 控制 机 制 ,在 每 个 客体 都 附加 一 个 可 访问 它 的 主体 的 明细 表 , 它 有 两 
种 形式 , 即 保护 位 和 访问 控制 表 。 

(1) 保护 位 (protection bit) 。 这 种 方法 对 所 有 主体 .主体 组 以 及 客体 的 拥有 者 指明 一 
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个 访问 模式 集合 。 保 护 位 机 制 不 能 完备 地 表达 访问 控制 矩阵 ,一 般 很 少 使 用 。 

(2) 访问 控制 表 (ACL)。 这 是 国际 上 流行 的 一 种 十 分 有 效 的 自主 访问 控制 模式 , 它 在 
每 个 客体 上 都 附加 一 个 主体 明细 表 , 表 示 访 问 控制 矩阵 。 表 中 的 每 一 项 都 包括 主体 的 身份 
和 主体 对 该 客体 的 访问 权限 。 它 的 一 般 结构 如 图 10-5 所 示 。 





客体 filel pirx | ID2.r ID3.x i IDn.rwx 




















图 10-5 访问 控制 表 


对 于 客体 filel ,主体 ID1 对 它 只 具有 读 (r) 和 运行 (x) 的 权力 ,主体 ID2 只 具有 读 权 力 ， 
主体 ID3 只 具有 运行 的 权力 ,而 主体 IDn 则 对 它 同时 具有 读 、 写 和 运行 的 权力 。 但 在 实际 
应 用 中 , 当 对 某 客体 可 访问 的 主体 很 多 时 ,访问 控制 表 将 会 变 得 很 长 。 而 在 一 个 大 系统 中 ， 
客体 和 主体 都 非常 多 ,这 时 使 用 这 种 一 般 形式 的 访问 控制 表 将 占用 很 多 CPU 时 间 。 因 此 
访问 控制 表 必 须 简化 ,例如 把 用 户 按 其 所 属 部 门 或 其 工作 性 质 进 行 分 类 ,构成 相应 的 组 
(group) ,并 设置 一 个 通配符 (wildcard)”* ”, 代 表 任何 组 名 或 主体 标识 符 , 如 图 10-6 所 示 。 





文件 APPLE | 





Jones | PLANE [ TWX | 
时 PLANE x 











图 10-6 访问 控制 表 的 优化 


图 10-6 中 PLANE 组 中 的 用 户 Jones 对 文件 APPLE 拥有 rwx 访问 权限 。PLANE 组 
中 的 其 他 用 户 拥有 rx 权限 。Rose 如 果 不 在 PLANE 组 中 ,就 没有 任何 权限 。 其 他 用 户 拥 
有 r 权 限 。 通 过 这 种 简化 ,访问 控制 表 就 大 大 地 缩小 了 ,效率 提高 了 ,并 且 也 能 够 满足 自主 
访问 控制 的 需要 。 


2. 强制 访问 控制 


在 强制 访问 控制 (Mandatory Access Control, MAC) 机 制 下 .系统 中 的 每 个 进程 ,文件 、 
IPC 客体 (消息 队列 \ 信 号 量 集合 和 共享 存储 区 ) 都 被 赋予 了 相应 的 安全 属性 ,这 些 安全 属性 
是 不 能 改变 的 , 它 由 管理 部 门 (如 安全 管理 员 ) 或 由 操作 系统 自动 地 按照 严格 的 规则 来 设置 ， 
不 像 访问 控制 表 那 样 ,可 由 用 户 或 他 们 的 程序 直接 或 间接 地 修改 。 当 一 个 进程 访问 一 个 客 
体 ( 如 文件 ) 时 ,调用 强制 访问 控制 机 制 ,根据 进程 的 安全 属性 和 访问 方式 ,比较 进程 的 安全 
属性 和 文件 的 安全 属性 ,从 而 确定 是 否 允许 进程 对 文件 的 访问 。 代 表 用 户 的 进程 不 能 改变 
自身 或 任何 客体 的 安全 属性 ,包括 不 能 改变 属于 用 户 的 客体 的 安全 属性 ,而 且 , 进 程 也 不 能 
通过 授予 其 他 用 户 对 文件 的 存 取 权 限 简单 地 实现 文件 共享 。 如 果 系 统 判定 拥有 某 一 安全 属 
性 的 主体 不 能 访问 某 个 客体 ,那么 任何 人 (包括 客体 的 拥有 者 ) 也 不 能 使 它 访问 该 客体 。 从 
这 种 意义 上 讲 , 它 是 “强制 "的 。 

强制 访问 控制 和 自主 访问 控制 是 两 种 不 同类 型 的 访问 控制 机 制 , 它 们 常 结合 起 来 使 用 。 
仅 当主 体能 够 同时 通过 自主 访问 控制 和 强制 访问 控制 检查 时 , 它 才能 访问 一 个 客体 。 用 户 
使 用 自主 访问 控制 防止 其 他 用 户 非法 入 侵 自己 的 文件 ,强制 访问 控制 则 作为 更 强 有 力 的 安 
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全 保护 方式 ,使 用 户 不 能 通过 意外 事件 和 有 意识 的 误 操作 逃避 安全 控制 。 因 此 ,强制 访问 控 
制 用 于 将 系统 中 的 信息 分 密级 \ 分 类 进行 管理 ,适用 于 政府 部 门 、 军 事 和 金融 等 领域 。 

通常 强制 访问 控制 可 以 有 许多 不 同 的 定义 ,但 它们 都 同 美国 国防 部 定义 的 多 级 安全 策 
略 接近 ,所 以 ,人 们 一 般 都 将 强制 访问 控制 和 多 级 安全 体系 相提并论 。 

多 级 安全 的 思想 产生 于 20 世纪 60 年 代 末 期 ,当时 美国 国防 部 决定 研究 开发 保护 计算 
机 中 机 密 信息 的 新 方式 。 其实 ,美国 国防 部 对 人 工 管理 和 存储 机 密 信息 早 有 严格 的 政策 , 即 
军事 安全 策略 。 多 级 安全 (MLS) 是 军事 安全 策略 的 数学 描述 ,是 计算 机 能 实现 的 形式 
定义 。 

1) 军事 安全 策略 

计算 机 内 的 所 有 信息 (如 文件 ) 都 具有 相应 的 密级 ,每 个 人 都 拥有 一 个 许可 证 。 为 了 确 
定 是 否 应 该 允许 某 人 阅读 一 个 文件 ,要 把 该 人 的 许可 证 同文 件 的 密级 进行 比较 。 仅 当 用 户 
的 许可 证 大 于 或 等 于 文件 的 密级 时 ,他 才 可 以 合法 地 获得 文件 的 信息 。 军 事 安全 策略 的 目 
的 是 防止 用 户 取得 他 不 应 得 到 的 密级 较 高 的 信息 。 密 级 、 安 全 属性 .许可 证 、 存 取 类 等 含义 
是 一 样 的 ,分 别 对 应 于 主体 或 客体 ,一 般 都 统称 安全 级 。 

安全 级 由 两 方面 构成 : 

(1) 保密 级 别 ( 或 称 为 敏感 级 别 或 级 别 ) 。 例 如 ,可 分 为 公开 秘密、 机 密 和 绝密 等 级 别 。 

(2) 范畴 集 。 该 安全 级 涉及 的 领域 ,如 人 事 处 、 财 务 处 等 。 

安全 级 包括 一 个 保密 级 别 , 范 畴 集 包含 任意 多 个 范畴 。 安 全 级 通常 写作 保密 级 别 后 随 
一 范畴 集 的 形式 ,例如 {机 密 ; 人 事 处 ,财务 处 ,科技 处 }。 实 际 上 ,范畴 集 常常 是 空 的 ,而 且 
很 少 有 几 个 范畴 名 。 

在 安全 级 中 保密 级 别 是 线性 排列 的 ,例如 * 公 开 二 秘密 志 机 密 志 绝密 ”; 范畴 则 是 互相 
独立 的 和 无 序 的 ,两 个 范畴 集 之 间 的 关系 是 包含 .被 包含 或 无 关 。 两 个 安全 级 之 间 的 关系 有 
以 下 几 种 : 

(1) 第 一 安全 级 支配 第 二 安全 级 , 即 第 一 安全 级 的 保密 级 别 不 小 于 第 二 安全 级 的 保密 
级 别 , 第 一 安全 级 的 范畴 集 包 含 第 二 安全 级 的 范畴 集 。 

(2) 第 一 安全 级 受 第 二 安全 级 支配 ,或 第 二 安全 级 支配 第 一 安全 级 , 即 第 二 安全 级 的 保 
密级 别 不 小 于 第 一 安全 级 的 保密 级 别 , 第 二 安全 级 的 范畴 集 包 含 第 一 安全 级 的 范畴 集 。 

(3) 第 一 安全 级 等 于 第 二 安全 级 , 即 第 一 安全 级 的 保密 级 别 等 于 第 二 安全 级 的 保密 级 
别 ,第 一 安全 级 的 范畴 集 包含 第 二 安全 级 的 范畴 集 , 同 时 第 二 安全 级 的 范畴 集 包 含 第 一 安全 
级 的 范畴 集 。 

(4) 两 个 安全 级 无 关 , 即 第 一 安全 级 的 范畴 集 不 包含 第 二 安全 级 的 范畴 集 , 同 时 第 二 安 
全 级 的 范畴 集 不 包含 第 一 安全 级 的 范畴 集 。 

“支配 ”这 一 单词 在 此 处 表示 偏 序 关系 , 它 类 似 于 “大 于 或 等 于 ”的 含义 。 例 如 ,一 个 文件 
的 安全 级 是 {机 密 : NATO, NUCLEAR}), 如 果 用 户 的 安全 级 为 {绝密 : NATO， 
NUCLEAR,CRYPTO} , 则 他 可 以 阅读 这 个 文件 ,因为 用 户 的 保密 级 别 高 ,涵盖 了 文件 的 范 
畴 。 相 反 , 具 有 安全 级 为 { 绝 密 : NATO,CRYTPO} 的 用 户 则 不 能 读 这 个 文件 ,因为 用 户 缺 
少 了 NUCLEAR 范畴 。 

2) 多 级 安全 规则 与 BLP 模型 

多 级 安全 计算 机 系统 的 第 一 个 数学 模型 是 Bell-La Padula 模型 (一 般 称 BLP 模型 ) , 它 
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是 由 David Bell 和 Leonard La Padula 于 1973 年 创立 的 ,是 模拟 符合 军事 安全 策略 的 计算 
机 操作 的 模型 ,是 最 早 的 也 是 最 常用 的 一 种 模型 ,已 实际 应 用 于 许多 安全 操作 系统 的 开发 
中 。BLP 模型 的 目标 就 是 详细 说 明 计 算 机 的 多 级 操作 规则 。 对 军事 安全 策略 的 精确 描述 
被 称 作 多 级 安全 策略 。 也 正 因为 BLP 模型 是 最 有 名 的 多 级 安全 策略 模型 ,所 以 常 把 多 级 安 
全 的 概念 与 BLP 模型 等 同 。 事 实 上 ,其 他 一 些 模型 也 符合 多 级 安全 策略 ,只 是 每 种 模型 都 
使 用 不 同 的 方法 表达 策略 ,但 它们 运用 的 策略 都 是 相同 的 。 

BLP 模型 有 两 条 基本 的 规则 ,如 图 10-7 所 示 。 

规则 1( 也 称 为 简单 安全 特性 ) : 一 个 主体 对 客体 进行 读 访问 的 必要 条 件 是 主体 的 安全 
级 支配 客体 的 安全 级 , 即 主体 的 保密 级 别 不 小 于 客体 的 保密 级 别 , 主 体 的 范畴 集 包含 客体 的 
全 部 范畴 。 即 主体 只 能 向 下 读 ,不 能 向 上 读 。 

规则 2( 也 称 为 * 特性 ) : 一 个 主体 对 客体 进行 写 访问 的 必要 条 件 是 客体 的 安全 级 支配 
主体 的 安全 级 , 即 客 体 的 保密 级 别 不 小 于 主体 的 保密 级 别 , 客 体 的 范畴 集 包含 主体 的 全 部 范 
畴 。 即 主体 只 能 向 上 写 ,不 能 向 下 写 。 


























主体 
WE 
客体 | 机 密 文件 | R 违背 规则 ! 公开 文件 | 客体 
- TS 久违 背 规则 2 
主体 


图 10-7 多 级 安全 规则 


规则 2 允许 一 个 主体 可 以 向 一 个 高 安全 级 的 客体 写 入 信息 。 从 信息 安全 的 角度 来 说 ， 
没有 理由 拒绝 向 上 写 的 方式 ,如 采用 追加 写 的 方式 允许 主体 把 信息 追加 到 它 不 能 读 的 文件 
末尾 。 这 种 想法 很 好 ,但 是 实现 却 相当 困难 。 实 际 上 ,大 多 数 实现 的 多 级 安全 系统 只 是 允许 
主体 向 与 它 的 安全 级 相等 的 客体 写 和 信息。 当然 ,为 使 主体 既 能 读 客体 又 能 写 该 客体 ,二 者 
的 安全 级 也 必须 相等 。 


3. 基于 角色 的 访问 控制 


1) 传统 访问 控制 方式 的 缺点 

在 传统 访问 控制 中 ,主体 始终 是 和 特定 的 实体 捆绑 对 应 的 。 例 如 ,用 户 以 固定 的 用 户 名 
注册 ,系统 分 配 一 定 的 权限 ,该 用 户 将 始终 以 该 用 户 名 访问 系统 ,直至 销 户 。 其 间 , 用 户 的 权 
限 可 以 变更 ,但 必须 在 系统 管理 员 的 授权 下 才能 进行 。 然 而 在 现实 社会 中 ,这 种 访问 控制 方 
式 表现 出 很 多 缺点 : 

(1) 同一 用 户 在 不 同 的 场合 需要 以 不 同 的 权限 访问 系统 ,按照 传统 做 法 ,变更 权限 必须 
经 系统 管理 员 授权 修改 ,因而 很 不 方便 。 

(2) 当 用 户 量 大 量 增加 时 , 按 每 用 户 一 个 注册 账号 的 方式 将 使 得 系统 管理 变 得 复杂 。 

(3) 传统 访问 控制 模式 不 容易 实现 层次 化 管理 。 按 每 用 户 一 个 注册 账号 的 方式 很 难 实 
现 系 统 的 层次 化 分 权 管 理 , 尤 其 是 当 同 一 用 户 在 不 同 场合 处 在 不 同 的 权限 层次 时 ,系统 管理 
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很 难 实现 。 除 非 同一 用 户 以 多 个 用 户 名 注册 。 

2) 基于 角色 的 访问 控制 模式 

基于 角色 的 访问 控制 模式 (Role Based Access Control,RBAC) 就 是 为 解决 以 上 问题 而 
提出 的 。 角 色 (role) 定 义 为 与 一 个 特定 活动 相关 联 的 一 组 动作 和 责任 。 一 个 主体 可 以 同时 
担任 多 个 角色 , 它 的 权限 就 是 多 个 角色 权限 的 总 和 。 例 如 ,在 一 个 银行 系统 中 ,可 以 定义 出 
纳 员 ,分 行 管理 者 、 系 统管 理 员 、 顾 客 、 审 计 员 等 角色 。 其 中 ,担任 系统 管理 员 的 用 户 具有 维 
护 系统 文件 的 责任 和 权限 。 系 统管 理 员 可 能 是 由 某 个 出 纳 员 兼任 的 ,他 就 具有 两 种 角色 。 
处 于 责任 分 离 的 考虑 ,需要 对 一 些 权 力 集中 的 角色 组 合 进 行 限制 ,例如 规定 分 行 管理 者 和 审 
计 员 不 能 由 一 个 用 户 担 任 。 

基于 角色 的 访问 控制 就 是 通过 定义 角色 的 权限 ,为 系统 中 的 主体 分 配角 色 来 实现 访问 



































控制 的 ,其 一 般 模型 如 图 10-8 所 示 。 用 户 经 认证 1. 认 证 3 请求 
后 获得 一 定 的 角色 ,该 角色 被 分 派 了 一 定 的 权 | 用 户 | | jh 色 上 | 权限 |] 
限 , 用 户 以 特定 角色 访问 系统 资源 ,访问 控制 机 Ba 

制 检查 角色 的 权限 ,并 决定 是 否 允许 用 户 访问 其 ee 

请 求 的 资源 。 态 问 控制 二 | 交流 ] 


基于 角色 的 访问 控制 ,提供 了 3 种 授权 管理 
的 控制 途径 : 改变 客体 的 访问 模式 , 即 修改 客体 可 
以 由 哪些 角色 访问 以 及 具体 的 访问 方式 ; 改变 角色 的 访问 权限 ; 改变 主体 所 担任 的 角色 。 

3) 基于 角色 的 访问 控制 策略 

以 前 面 的 银行 系统 的 角色 模型 为 例 , 可 以 设计 如 下 的 访问 控制 策略 : 

(1) 允许 出 纳 员 修 改 顾客 的 账号 记录 (包括 存款 、 取 款 、 转 账 等 ), 并 允许 出 纳 员 查 询 所 
有 账号 的 注册 项 。 

(2) 允许 分 行 管理 者 修改 顾客 的 账号 记录 (包括 存款 、 取 款 ,但 不 包括 规定 的 资金 数目 
的 范围 ), 并 允许 分 行 管理 者 查询 所 有 账号 的 注册 项 ,还 可 以 创建 和 取消 账号 。 

(3) 允许 一 个 顾客 查询 自己 的 注册 项 ,但 不 能 查询 其 他 任何 注册 项 。 

(4) 允许 系统 管理 员 查 询 系统 注册 项 和 开关 系统 ,但 不 允许 其 读 取 或 修改 顾客 的 账号 
信息 。 

(5) 允许 审计 员 阅 读 系统 中 所 有 的 信息 ,但 不 允许 修改 任何 信息 。 

这 种 策略 表示 方法 和 现实 世界 一 致 ,使 得 非 技 术 人 员 也 容易 理解 ,也 很 容易 映射 到 访问 
矩阵 和 基于 组 的 自主 访问 控制 ,便于 实现 。 

4) 基于 角色 的 访问 控制 模式 的 优点 

RBAC( 基 于 角色 的 访问 控制 ) 具 有 以 下 优点 : 

(1) 系统 中 所 有 角色 的 关系 结构 可 以 是 层次 化 的 ,便于 管理 。 角 色 的 定义 是 从 现实 出 发 
的 ,所 以 可 以 用 面向 对 象 的 方法 实现 ,运用 类 和 继承 等 概念 表示 角色 之 间 的 层次 关系 非常 自然 。 

(2) 具有 较 好 的 提供 最 小 权利 的 能 力 ,从 而 提高 了 安全 性 。 由 于 对 主体 的 授权 是 通过 
角色 定义 的 ,因此 调整 角色 的 权限 粒度 可 以 做 到 更 有 针对 性 。 不 同意 出 现 多 余 权 限 。 

(3) 具有 责任 分 离 的 能 力 。 定 义 角色 的 人 不 一 定 是 担任 角色 的 人 ,因此 不 同 角色 的 访 
问 权限 可 以 相互 制约 ,从 而 具有 更 高 的 安全 性 。 

如 上 所 述 ,RBAC 很 好 地 解决 了 企业 关系 信息 系统 中 用 户 数量 多 、 变 动 频 繁 的 问题 ,是 


图 10-8 基于 角色 的 访问 控制 模型 
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实施 面向 企业 的 安全 策略 的 一 种 有 效 的 访问 控制 模式 , 它 具 有 灵活 性 、 方 便 性 和 安全 性 的 特 
点 ,目前 在 大 型 数据 库 系统 的 权限 管理 中 得 到 了 普遍 的 应 用 。 但 是 在 大 型 开放 式 分 布 式 网 
络 环境 下 ,通常 无 法 确 知 网 络 实体 的 身份 真实 性 和 授权 信息 ,而 BRAC 无 法 实现 对 未 知 用 
户 的 访问 控制 和 委托 授权 机 制 , 从 而 限制 了 RBAC 在 网 络 环境 下 的 应 用 。RBAC 目前 仍 处 
于 发 展 阶段 ,其 应 用 仍然 相当 复杂 。 


10.2.4 最 小 权限 管理 


在 安全 操作 系统 中 ,为 了 维护 系统 的 正常 运行 ,管理 员 往 往 需 要 一 定 的 权限 直接 执行 一 
些 受 限 的 操作 或 进行 超越 安全 策略 控制 的 访问 。 传 统 的 超级 用 户 权 限 管理 模式 , 即 超级 用 
户 /进程 搜 有 所 有 权限 ,而 普通 用 户 / 进 程 不 具有 任何 权限 ,这 便于 系统 的 维护 和 配置 , 却 不 
利于 系统 的 安全 性 。 一 旦 超级 用 户 的 口令 丢失 或 超级 用 户 被 冒充 ,将 会 对 系统 造成 极 大 的 
损失 。 另 外 ,超级 用 户 的 误 操作 也 是 系统 极 大 的 潜在 安全 隐患 。 因 此 ,TCSEC 标准 对 B2 
级 以 上 安全 操作 系统 均 要 求 提供 最 小 权限 管理 安全 保证 。 

最 小 权限 管理 的 思想 是 系统 不 应 给 用 户 / 管 理 员 超过 执行 任务 所 需 权限 以 外 的 权限 。 
例如 将 超级 用 户 的 权限 划分 为 一 组 细 粒 度 的 权限 ,分 别 授予 不 同 的 系统 操作 员 / 管 理 员 , 使 
各 种 系统 操作 员 / 管 理 员 只 具有 完成 其 任务 所 需 的 权限 ,从 而 减少 由 于 权限 用 户口 令 丢 失 或 
错误 软件 、 恶 意 软件 、. 误 操作 引起 的 损失 。 

例如 ,对 于 一 个 Windows 系统 管理 员 用 户 ,登录 后 就 具有 管理 员 权限 的 访问 令 牌 ,而 该 
用 户 运行 的 程序 也 将 具有 管理 员 权 限 ,对 系统 具有 完全 控制 的 权力 。 假 设 该 用 户 从 电子 邮 
件 中 收 到 了 一 个 带 有 病毒 的 附件 , 则 这 个 病毒 会 恶意 修改 系统 设置 。 如 果 运 行 了 该 附件 ,这 
个 附件 也 将 具有 管理 员 的 权限 ,因此 完全 可 以 实现 目的 ,修改 系统 设置 。 但 如 果 该 用 户 是 标 
准 / 受 限 用 户 , 没 有 修改 这 个 系统 设置 的 权限 ,那么 该 用 户 运行 感染 病毒 的 附件 后 ,病毒 虽然 
可 以 运行 起 来 ,但 因为 缺少 权限 ,无 法 修改 系统 设置 ,这 也 就 直接 防止 了 病毒 的 破坏 。 

在 Windows Vista 中 , 当 用 户 使 用 管理 员 账 户 登录 时 , Windows 会 为 该 账户 创建 两 个 
访问 令 牌 ,一 个 是 标准 令 牌 , 另 一 个 是 管理 员 令 牌 。 一 般 情况 下 , 当 用 户 试图 访问 文件 或 运 
行程 序 时 ,系统 都 会 自动 使 用 标准 令 牌 只 有 在 权限 不 足 , 也 就 是 说 ,如 果 程 序 宣称 需要 管 
理 员 权限 时 ,系统 才 会 使 用 管理 员 令 牌 。 这 种 将 管理 员 权 限 区 别 对 待 的 机 制 就 叫做 用 户 账 
户 控制 (User Account Control,UAC) 。 在 Windows 7 中 ,UAC 有 了 进一步 的 改进 。 为 用 
户 提供 了 4 种 配置 选择 。 


10.2.5 可 信 路 径 


在 计算 机 系统 中 ,用 户 是 通过 不 可 信 的 中 间 应 用 层 和 操作 系统 相互 作用 的 。 但 在 用 户 
登录 、 定 义 用 户 的 安全 属性 \ 改 变 文件 的 安全 级 等 操作 中 ,用 户 必须 确实 与 安全 核心 通信 ,而 
不 是 与 一 个 特洛伊 木马 打交道 。 系 统 必须 防止 特洛伊 木马 模仿 登录 过 程 , 窃 取 用 户 的 口令 。 
特权 用 户 在 进行 特权 操作 时 ,也 要 有 办 法 证 实 从 终端 上 输出 的 信息 是 正确 的 ,而 不 是 来 自 特 
洛 伊 木 马 。 这 些 都 需要 一 个 机 制 保障 用 户 和 内 核 的 通信 ,这 种 机 制 就 是 由 可 信 路 径 提 供 的 。 

提供 可 信 路 径 的 一 个 办 法 是 给 每 个 用 户 两 台 终端 ,一 台 做 通常 的 工作 , 另 一 台 用 作 与 内 
核 的 硬 连接 。 这 种 办 法 虽然 十 分 简单 ,但 太 昂贵 了 。 对 用 户 建立 可 信 路 径 的 一 种 现实 方法 
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是 使 用 通用 终端 ,通过 发 信号 给 核心 。 这 个 信和 号 是 不 可 信和 软件 不 能 拦截 覆盖 或 伪造 的 。 一 
般 称 这 个 信和 号 为 安全 注意 键 (Secure Attention Key,SAK) 。 早 先 实现 可 信 路 径 的 做 法 是 将 
终端 上 的 一 些 由 内 核 控制 的 特殊 信号 或 屏幕 上 空 出 的 特殊 区 域 用 于 和 内 核 的 通信 。 今 天 大 
多 数 终端 已 经 十 分 智能 ,内 核 要 使 该 机 制 不 被 特洛伊 木马 欺骗 是 十 分 困难 的 。 

为 了 使 用 户 确 信 自 己 的 用 户 名 和 口令 不 被 别人 窃 走 ,Linux 提供 了 安全 注意 键 。 安 全 
注意 键 是 一 个 键 或 一 组 键 ( 在 x86 平台 上 ,SAK 是 ALT 十 SysRq 十 K) , 按 下 它 ( 们 ) 后 ,保证 
用 户 看 到 真正 的 登录 提示 ,而 非 登录 模拟 器 。 即 它 保证 是 真正 的 登录 程序 (而 非 登录 模拟 
器 ) 读 取 用 户 的 账号 和 口令 ( 详 见 linux/drivers/char/sysrq. c 和 linux/drivers/char/tty_io. 
c::do SAK)。SAK 可 以 用 下 面 的 命令 来 激活 : 





echo "1">/proc/sys/kernel/sysrq 


严格 地 说 ,Linux 中 的 SAK 并 未 构成 一 个 可 信和 路 径 , 因 为 尽管 它 会 杀 死 正在 监听 终端 
设备 的 登录 模拟 器 ,但 它 不 能 阻止 登录 模拟 器 在 按 下 SAK 后 立即 开始 监听 终端 设备 ,事实 
上 实现 这 样 的 登录 模拟 器 并 不 难 。 当 然 由 于 Linux 限制 用 户 使 用 原始 设备 的 特权 ,普通 用 
户 无 法 执行 这 种 高 级 模拟 器 ,而 只 能 以 ROOT 身份 运行 ,这 就 减 小 了 它 所 带 来 的 威胁 。 


10.2.6 审计 


一 个 系统 的 安全 审计 就 是 对 系统 中 有 关 安 全 的 活动 进行 记录 、 检 查 及 审核 。 它 的 主要 
目的 就 是 检测 和 阻止 非法 用 户 对 计算 机 系统 的 入 侵 ,并 显示 合法 用 户 的 误 操 作 。 审 计 作为 
一 种 事后 追查 的 手段 来 保证 系统 的 安全 , 它 对 涉及 系统 安全 的 操作 做 一 个 完整 的 记录 。 审 
计 为 系统 进行 事故 原因 的 查询 .定位 ,事故 发 生前 的 预测 .报警 以 及 事故 发 生 之 后 的 实时 处 
理 提供 详细 、 可 靠 的 依据 和 支持 ,以 备 有 违反 系统 安全 规则 的 事件 发 生 后 能 够 有 效 地 追查 事 
件 发 生 的 地 点 、 过 程 以 及 责任 人 。 

因此 ,审计 是 操作 系统 安全 的 一 个 重要 方面 ,安全 操作 系统 也 都 要 求 用 审计 方法 监视 安 
全 相关 的 活动 。 美 国 国防 部 的 “ 桥 皮 书 ” 中 就 明确 要 求 “ 可 信 计 算 机 必须 向 授权 人 员 提 供 一 
种 能 力 ,以便 对 访问 、 生 成 或 泄露 秘密 或 敏感 信息 的 任何 活动 进行 审计 。 根 据 一 个 特定 机 制 
或 特定 应 用 的 审计 要 求 , 可 以 有 选择 地 获取 审计 数据 。 但 审计 数据 中 必须 有 足够 细 的 粒度 ， 
以 支持 对 一 个 特定 个 体 已 发 生 的 动作 或 代表 该 个 体 发 生 的 动作 进行 追踪 ”。 在 我 国 GB 
17859 一 1999《 计 算 机 信息 系统 安全 保护 等 级 划分 准则 ) 中 也 有 相应 的 要 求 。 

如 果 将 审计 和 报警 功能 结合 起 来 ,就 可 以 做 到 每 当 有 违反 系统 安全 的 事件 发 生 或 者 有 
涉及 系统 安全 的 重要 操作 进行 时 就 及 时 向 安全 操作 员 终 端 发 送 相应 的 报警 信息 。 审 计 一 般 
是 一 个 独立 的 过 程 , 它 应 与 系统 其 他 功能 相隔 离 。 同 时 ,要 求 操作 系统 必须 能 够 生成 、 维 护 
及 保护 审计 过 程 , 使 其 免 遭 修改 ,非法 访问 及 毁坏 ,特别 要 保护 审计 数据 ,要 严格 限制 未 经 授 
权 的 用 户 访问 它 。 


(i0,3 Linux 操作 系统 的 安全 性 


Linux 系统 作为 类 UNIX 系统 ,由 于 其 源码 开放 、 免 费 试用 和 可 自由 传播 而 得 到 了 广泛 
的 应 用 。 经 过 二 十 多 年 的 发 展 ,Linux 的 安全 机 制 日 趋 完 善 ,目前 按照 TCSEC(CTrusted 
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Computer System Evaluation Criteria, 美 国 可 信 计 算 机 安全 评估 标准 ) 的 评估 已 经 达到 了 
C2 级 。Linux 的 安全 机 制 主 要 有 PAM 机 制 、 文 件 系统 加 密 、 入 侵 检测 机 制 、 安 全 日 志文 件 
机 制 、 强 制 访问 机 制 、 防 火 墙 机 制 等 。 


10.3.1 PAM 机 制 


PAM(Pluggable Authentication Module, 可 插 拔 认证 模块 ) 是 一 种 高 效 而 且 灵 活 便利 
的 用 户 级 别 的 认证 方式 。 最 初 它 是 由 美国 Sun 公司 为 Solaris 操作 系统 开发 的 ,后 来 ,很 多 
操作 系统 都 实现 了 对 它 的 支持 , 它 是 当前 Linux 服务 器 普遍 使 用 的 认证 方式 。PAM 最 大 
的 特点 是 实现 了 服务 程序 和 认证 机 制 的 分 离 , 它 采用 模块 化 设计 和 插件 功能 ,使 得 我 们 可 以 
轻易 地 在 应 用 程序 中 插入 新 的 鉴别 模块 或 蔡 换 原先 的 组 件 ,而 不 必 对 应 用 程序 做 任何 修改 ， 
从 而 使 软件 的 定制 、 维 持 和 升级 更 加 轻松 ,这 是 因为 鉴别 机 制 与 应 用 程序 之 间 相 对 独立 。 应 
用 程序 可 以 通过 PAM API 方便 地 使 用 PAM 提供 的 各 种 鉴别 功能 ,而 不 必 了 解 太 多 的 底层 
细节 ; PAM 服务 模块 的 开发 者 还 可 以 通过 PAM 提供 的 SPI 来 编写 认证 模块 。 此 外 ,PAM 
的 易 用 性 也 较 强 ,主要 表现 在 它 对 上 层 屏蔽 了 认证 的 具体 细节 ,所 以 用 户 不 必 被 迫 学 习 各 种 
各 样 的 认证 方式 ,也 不 必 记 住 多 个 口令 ; 又 由 于 它 实现 了 多 种 鉴别 机 制 的 集成 管理 ,所 以 单 
个 程序 可 以 非常 容易 地 使 用 多 种 鉴别 机 制 如 Kerberos 认证 和 NIS 认证 机 制 等 ,但 用 户 仍 可 
以 用 同一 个 口令 登录 。 在 这 个 过 程 中 用 户 根本 感觉 不 到 系统 采取 了 何 种 认证 方法 。 同 时 ， 
PAM 为 更 有 效 的 认证 方法 的 开发 提供 了 便利 ,在 此 基础 上 可 以 很 容易 地 开发 出 蔡 代 常规 
的 用 户 名 加 口令 的 认证 方法 ,如 智能 卡 、 指 纹 识别 等 认证 方法 。 


10.3.2 文件 系统 加 密 


加 密 技术 在 现代 计算 机 系统 安全 中 扮演 着 越 来 越 重要 的 角色 。 目 前 已 有 多 种 加 密 文件 
系统 ,如 CFS、TCFS、CRYPTEFS 等 , 较 有 代表 性 的 是 TCFS (Transparent Cryptographic 
File System) 。 它 通过 将 加 密 服 务 和 文件 系统 紧密 集成 ,使 用 户 感觉 不 到 文件 的 加 密 过 程 。 
TCFS 不 修改 文件 系统 的 数据 结构 ,备份 与 修复 以 及 用 户 访 问 保密 文件 的 语义 也 不 变 。 
TCFS 能 够 做 到 让 保密 文件 系统 的 数据 结构 对 以 下 用 户 不 可 读 : @ 合 法 拥有 者 以 外 的 用 
户 ; @@ 用 户 和 远程 文件 系统 通信 线路 上 的 偷 听 者 ; @@ 文 件 系统 服务 器 的 超级 用 户 。 而 对 于 
合法 用 户 ,访问 保密 文件 与 访问 普通 文件 几乎 没有 区 别 。 


10.3.3 网 络 监控 与 入 侵 检 测 


入 侵 检测 技术 是 一 项 比较 新 的 技术 。 利 用 Linux 配备 的 入 侵 检 测 工 具 和 从 因特网 上 下 
载 的 工具 ,就 可 以 使 Linux 系统 具备 较 强 的 人 侵 检测 能 力 。 包 括 让 Linux 记录 入 侵 企 图 , 当 
攻击 发 生 时 及 时 通知 管理 员 ; 让 Linux 在 规定 情况 的 攻击 发 生 时 ,采取 事先 确定 的 措施 ; 
让 Linux 发 出 一 些 错 误 信 息 ,例如 模仿 成 其 他 操作 系统 ,以 增加 攻击 者 的 攻击 难度 。 

常见 的 方式 有 利用 扫描 器 检测 安全 漏洞 ,利用 嗅 探 器 监听 网 络 上 的 信息 。 系 统 扫描 器 
可 以 扫描 本 地 主机 ,防止 不 严格 或 者 不 正确 的 文件 许可 权 、 默 认 的 账户 、 错 误 或 重复 的 UID 
项 等 ; 网 络 扫描 器 可 以 对 网 上 的 主机 检查 各 种 服务 和 端口 ,发 现 可 能 被 远程 攻击 者 利用 的 
漏洞 ,例如 著名 的 扫描 器 SATAN。 
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10.3.4 强制 访问 控制 


Linux 是 一 种 自由 操作 系统 ,有 好 几 种 产品 都 实现 了 强制 访问 控制 。 如 SELinux、 
RSBAC MAC 等 ,每 种 产品 采用 的 策略 都 不 相同 。 

SELinux(Security-Enhanced Linux) 是 美国 国家 安全 局 (NSA) 对 于 强制 访问 控制 的 实 
现 ,是 Linux 历史 上 最 杰出 的 新 安全 子 系统 。 它 是 NSA 在 Linux 社区 的 帮助 下 开发 的 一 种 
访问 控制 体系 ,在 这 种 访问 控制 体系 的 限制 下 ,进程 只 能 访问 那些 在 他 的 任务 中 所 需要 的 文 
件 。SELinux 默认 安装 在 Fedora 和 Red Hat Enterprise Linux 上 ,也 可 以 作为 其 他 发 行 版 
的 安装 包 得 到 。 对 于 目前 可 用 的 Linux 安全 模块 来 说 ,SELinux 功能 最 全 面 ,而 且 测 试 最 充 
分 , 它 是 在 20 年 的 MAC 研究 基础 上 建立 的 。SELinux 在 类 型 强制 服务 器 中 合并 了 多 级 安 
全 性 或 一 种 可 选 的 多 类 策略 ,并 采用 了 基于 角色 的 访问 控制 概念 。SELinux 提供 了 比 传统 
的 Linux 权限 更 好 的 访问 控制 。SELinux 提供 了 一 种 灵活 的 强制 访问 控制 (MAC) 系 统 , 且 
内 艇 于 Linux Kernel 中 。SELinux 定义 了 系统 中 每 个 用 户 .进程 .应 用 和 文件 的 访问 和 转 
变 的 权限 ,然后 它 使 用 一 个 安全 策略 来 控制 这 些 实体 (用 户 .进程 .应 用 和 文件 ) 之 间 的 交互 ， 
安全 策略 指定 如 何 严格 或 宽松 地 进行 检查 。SELinux 开始 是 由 NSA 启动 并 加 入 到 Linux 
系统 中 的 一 套 核心 组 件 及 用 户 工 具 , 可 以 让 应 用 程序 运行 在 其 所 需 的 最 低 权 限 上 。 未 经 修 
改过 的 Linux 系统 是 使 用 自主 访问 控制 的 ,用 户 可 以 自己 请 求 更 高 的 权限 ,由 此 恶意 软件 几 
乎 可 以 访问 任何 它 想 访问 的 文件 ; 而 如 果 用 户 被 授予 root 权限 , 那 他 就 无 所 不 能 了 。 
SELinux 中 没有 root 这 个 概念 ,安全 策略 是 由 管理 员 来 定义 的 ,任何 软件 都 无 法 取代 它 。 
这 意味 着 那些 潜在 的 恶意 软件 所 能 造成 的 损害 可 以 被 控制 在 最 小 范围 内 。 一 般 情况 下 只 有 
非常 注重 数据 安全 的 企业 级 用 户 才 会 使 用 SELinux。 在 Android 4. 2 中 ,SELinux 是 可 选 
项 ,谷歌 并 没有 直接 取消 root 权限 或 其 他 功能 。 这 是 一 个 为 企业 级 用 户 或 对 隐私 数据 极为 
重视 的 用 户 提供 的 选项 ,普通 消费 者 则 完全 可 以 关闭 它 。 

RSBAC(Rule Set Based Access Control, 基 于 规则 集 的 访问 控制 ) 是 根据 Abrams 和 La 
Padula 提出 的 Generalized Framework for Access Control(GFAC) 模 型 开发 的 ,可 以 基于 多 
个 模块 提供 灵活 的 访问 控制 。 所 有 与 安全 相关 的 系统 调用 都 扩展 了 安全 实施 代码 ,这 些 代 
码 调用 中 央 决 策 部 件 , 该 部 件 随后 调用 所 有 激活 的 决策 模块 ,形成 一 个 综合 的 决定 ,然后 由 
系统 调用 扩展 代码 来 实施 这 个 决定 。RSBAC 目前 包含 的 模块 主要 有 MAC、RBAC、 
ACL 等 。 

MAC 是 英国 的 Malcolm Beattie 针对 Linux 2. 2 编写 的 一 个 非常 初级 的 强制 访问 控制 
系统 , 它 将 一 个 运行 的 Linux 系统 分 隔 成 多 个 互 不 可 见 的 (或 者 互相 限制 的 ) 子 系统 ,这些 子 
系统 可 以 作为 单一 的 系统 来 管理 。MAC 是 基于 传统 的 Biba 完整 性 模型 和 BLP 模型 实现 
的 ,但 作者 目前 似乎 没有 延续 他 的 工作 。 


10.3.5 安全 审计 


即使 系统 管理 员 十 分 精明 地 采取 了 各 种 安全 措施 ,但 还 会 不 幸 地 发 现 一 些 新 漏洞 。 攻 
击 者 在 漏洞 被 修补 之 前 会 迅速 抓 住 机 会 攻破 尽 可 能 多 的 机 器 。 虽 然 Linux 不 能 预测 何 时 主 
机 会 受到 攻击 ,但 是 它 可 以 记录 攻击 者 的 行踪 。 
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Linux 还 可 以 进行 检测 .记录 时 间 信 息 和 网 络 连接 情况 。 这 些 信息 将 被 重 定 向 到 日 志 
中 备查 。 

日 志 是 Linux 安全 结构 中 的 一 个 重要 内 容 , 丰 富 的 日 志 内 容 为 Linux 的 安全 运行 提供 
了 保障 。 因 为 现在 的 攻击 方法 多 种 多 样 ,所 以 Linux 提供 网 络 .主机 和 用 户 级 的 日 志 信息 。 

见 的 日 志文 件 如 下 : 

/var/log/acct 或 pacct, 记 录 每 个 用 户 使 用 过 的 命令 。 

/var/log/cron, 工 作 调 度 。 

/var/log/dmesg, 内 核 检 测 过 程 中 产生 

/var/log/lastlog ,检测 所 有 账号 登录 信息 。 

/var/log/loginlog ,不 良 的 登录 尝试 记录 。 

/var/log/maillog 或 /var/log/mail/ * ,邮件 。 

/var/log/messages, 记 录 系 统 发 生 的 所 有 错误 信息 。 

/var/log/secure, 涉 及 账号 密码 信息 。 

/var/log/wtmp, 记 录 每 一 次 用 户 登录 和 撤销 的 历史 信息 以 及 系统 的 关 和 开 。 

/var/log/faillog, 记 录 正 确 登录 系统 与 错误 登录 系统 者 的 账号 信息 。 

/var/1log/xferlog, 记 录 FTP 的 访问 情况 。 

/var/log/httpd/ * 或 /var/log/news/ * 或 /var/log/samba/* ,记录 不 同 网 络 服务 的 






信息 。 


信息 。 
在 调查 网 络 人 侵 者 的 时 候 , 即 使 这 种 调查 是 在 实际 攻击 发 生 之 后 进行 的 ,日 志 信息 也 是 
不 可 缺少 的 。 


10.3.6 防火 墙 机 制 


防火 墙 是 在 被 保护 网 络 和 因特网 之 间或 者 在 其 他 网 络 之 间 限 制 访问 的 一 种 部 件 或 一 系 
列 部 件 。Linux 防火 墙 系统 提供 了 如 下 功能 : 

(1) 访问 控制 。 可 以 执行 基于 地 址 ( 源 和 目标 ) 、 用 户 和 时 间 的 访问 控制 策略 ,从 而 可 以 
杜绝 非 授 权 的 访问 ,同时 保护 内 部 用 户 的 合法 访问 不 受 影响 。 

(2) 审计 。 对 通过 它 的 网 络 访问 进行 记录 ,建立 完备 的 日 志 、 审 计 和 追踪 网 络 访问 记 
录 , 并 可 以 根据 需要 产生 报表 。 

(3) 抗 攻击 。 防 火 墙 系统 直接 暴露 在 非 信任 网 络 中 ,对 外 界 来 说 ,受到 防火 墙 保护 的 内 
部 网 络 如 同一 个 点 ,所 有 的 攻击 都 是 直接 针对 它 的 ,该 点 称 为 堡垒 机 ,因此 要 求 堡垒 机 具有 
高 度 的 安全 性 和 抵御 各 种 攻击 的 能 力 。 

(4) 其 他 附属 功能 ,如 与 审计 相关 的 报警 和 入 侵 检测 ,与 访问 控制 相关 的 身份 验证 、 加 
密 和 认证 ,甚至 VPN 等 。 


习题 


1. 操作 系统 会 面临 哪些 安全 方面 的 威胁 ? 
2. 操作 系统 的 硬件 保护 机 制 包括 哪 几 方面 的 内 容 ? 
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3. 自主 访问 控制 与 强制 访问 控制 有 哪些 异同 点 ? 
4. 什么 是 最 小 权限 管理 ? 举例 说 明 。 

5. 系统 进行 安全 审计 的 目的 是 什么 ? 

6. Linux 操作 系统 采用 了 哪些 安全 机 制 ? 

7. 什么 是 PAM 机 制 ? PAM 机 制 有 什么 优点 ? 
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邮 编 : 100084 
电 话 : 010 一 62770175 一 4604 


资源 下 载 : http://www. tup.com.cn 





电子 邮件 : weijj@tup. tsinghua. edu. cn 


QQ: 883604( 请 写 明 您 的 单位 和 姓名 ) 





用 微 信 扫 一 扫 右 边 的 二 维 码 , 即 可 关注 清华 大 学 出 版 社 公 众 号 “ 书 圈 ”。 


